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E CONCEPTO DE PSICOLOGÍA DEL LENGUAJE 


OBJETIVOS DE APRENDIZAJE 
Al finalizar el capítulo el alumno será capaz de: 
e Entender los fundamentos de la psicología del lenguaje y diferenciar esta disciplina de 
otras relacionadas como la lingúística o la sociolingúística. 
e Conocer los antecedentes históricos de la psicología del lenguaje y los primeros pasos 
de esta joven disciplina. 
e Comprender los componentes del sistema de procesamiento del lenguaje y las 
principales teorías sobre su funcionamiento. 
e Conocer las principales metodologías de investigación empleadas por la psicología del 
lenguaje. 


INTRODUCCIÓN 

La psicología del lenguaje, también denominada psicolingúística, es la parte de la psicología 
dedicada a estudiar la forma en que los seres humanos procesamos el lenguaje. Su objetivo 
es, por lo tanto, explicar cómo comprendemos y producimos el lenguaje, es decir, cuáles son 
los mecanismos cognitivos y cerebrales que nos permiten expresar nuestras ideas y 
sentimientos a través de los sonidos y entender los mensajes que nos llegan de otros 
hablantes. 

Aunque en el pasado se hicieron algunas distinciones entre psicología del lenguaje y psi- 
colingúística, hoy en día prácticamente todos los autores consideran ambas denominaciones 
intercambiables. El término psicolingúística surgió cuando esta disciplina comenzó a rodar, a 
principios de los años cincuenta del siglo pasado, fruto del trabajo conjunto de psicólogos y 
lingúistas. Y si en ella participaban las dos disciplinas era lógico que el nombre surgiera de 
la unión de las dos. Tal como irónicamente señalaban algunos autores: «Se trata de un 
matrimonio entre la psicología y la lingúística, en la que aquélla lleva la voz cantante» 
(Taylor yTaylor, 1990). Posteriormente, con el «divorcio» de los psicólogos y los lingúistas, 
algunos prefirieron el término de psicología del lenguaje que parecía menos «lingúístico», 
pero otros siguieron utilizando el término psicolingúística. Actualmente se consideran 
equivalentes y así se puede ver en los distintos manuales. Por lo tanto, en este libro 
utilizaremos ambos términos indistintamente sin que exista ningún tipo de connotación 
diferencial. 

La psicología del lenguaje o psicolingúística forma parte de la psicología cognitiva, la rama 
de la psicología dedicada al estudio de la mente humana o, en otras palabras, a conocer cómo 
percibimos la información que nos llega del exterior, cómo la procesamos y almacenamos, 
cómo razonamos y solucionamos problemas, etc.; dentro de la psicología cognitiva hay 
especialidades, como la psicología de la memoria, la psicología de la atención o la psicología 
del lenguaje. 
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En un principio, los psicólogos del lenguaje se dedicaban a investigar los mecanismos 
cognitivos que nos permiten comprender y producir el habla; sin embargo, en los últimos 
años, con el desarrollo de nuevas tecnologías de investigación, fundamentalmente las de 
neuroimagen, se interesan también por conocer los mecanismos neuronales responsables del 
procesamiento lingúístico. Actualmente, el psicolingúista ya no se conforma con describir 
los procesos cognitivos responsables de los fenómenos del lenguaje, por ejemplo del 
reconocimiento de palabras escritas o de la recuperación de palabras en el habla espontánea, 
sino que trata de conocer qué áreas del cerebro participan en estos procesos. Como se verá en 
el capítulo 3, dedicado a la relación cerebro-lenguaje, las técnicas fisiológicas, como los 
potenciales evocados o la neuroimagen, se han convertido en metodologías básicas de la 
investigación de la psicología del lenguaje, y ésta, a su vez, se ha convertido en una parte 
importante de la neurociencia cognitiva. 

Los dos campos básicos de la psicología del lenguaje son la comprensión y la producción, 
tanto en su forma oral como escrita, aunque en el mundo anglosajón también incluyen el 
campo de la adquisición del lenguaje. Por lo tanto, esta disciplina estudia todas las 
operaciones que realizamos desde que llegan los sonidos del habla hasta nuestros oídos, o los 
signos gráficos de la escritura a nuestros ojos, hasta que extraemos el mensaje y lo 
integramos en nuestros propios conocimientos. Y, a la inversa, desde que planificamos un 
mensaje en nuestra mente hasta que lo transformamos en sonidos que pronunciamos o en 
letras que escribimos sobre el papel o la pantalla del ordenador. Esto es lo que recogen las 
principales definiciones que se han dado de esta disciplina. 


Recuadro 1-1. DEFINICIONES DE PSICOLOGÍA DEL LENGUAJE O 
PSICOLINGUÍSTICA: 
A lo largo de los años se han propuesto muchas definiciones de psicología del lenguaje, o 


psicolinguistica. Sirvan algunas de muestra: 

* La psicolinguistica se ocupa del estudio de los mecanismos mentales que hacen posible a 
la gente usar el lenguaje. Su objetivo es conocer la forma en que el lenguaje es entendido y 
producido (Garnham, 1985). 

* Nosotros queremos saber qué ocurre dentro de las cabezas de las gentes cuando hablan, 
escuchan, escriben o leen (Ellis y Beattie, 1986). 

* La psicolinguistica es el estudio de la conducta lingúística: cómo la gente real (por 
oposición a ideal) aprende y usa el lenguaje para comunicar ideas. Intenta responder a 
preguntas sobre cómo se produce, percibe, comprende y recuerda el lenguaje. Cómo se usa, 
cómo se adquiere y cómo está representado en la mente (Taylor y Taylor, 1990). 

* La psicolinguistica es el estudio de los procesos psicológicos implicados en el lenguaje. 
Los psicolingúistas estudian la comprensión, producción y recuerdo del lenguaje (Harley, 
2009). 

* La psicolinguistica es un campo interdisciplinario que abarca la psicología y disciplinas 
relacionadas con el estudio de los procesos del lenguaje. Se centra en los procesos 
necesarios para adquirir, producir o comprender el lenguaje (Jay, 2003). 
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* La psicolinguistica es el estudio de cómo los individuos comprenden, producen y 
adquieren el lenguaje. Es parte del campo de la ciencia cognitiva (Carroll, 2006). 


Obviamente, no somos los psicólogos los únicos interesados en el estudio del lenguaje. El 
lenguaje humano es una realidad polifacética y multidisciplinar, como se analizará en el 
capítulo 2, que puede abordarse desde diversas perspectivas epistemológicas. Varias son las 
disciplinas científicas que, de un modo u otro, se ocupan de su estudio. Pero los objetivos 
que persiguen y las metodologías que utilizan son diferentes. 

Sin duda, la disciplina más relacionada es la lingúística, ya que su objeto de estudio es 
justamente el lenguaje. La lingúística estudia los elementos formales que constituyen una 
lengua y las reglas que rigen la relación entre esos elementos. Estos conocimientos son muy 
útiles para los psicólogos, pues conocer las reglas que rigen la unión de los fonemas en las 
palabras o las que rigen la unión de las palabras en oraciones son, sin duda, fundamentales 
para investigar el procesamiento léxico y el sintáctico, respectivamente, pero nuestro interés 
como psicólogos del lenguaje es conocer cómo procesamos los individuos el lenguaje más 
que describir sus elementos formales. De hecho, las características de los estímulos que 
interesan a lingiiistas y psicólogos pueden ser muy diferentes. Así, por ejemplo, una de las 
variables más importante de las palabras en lingúística es la categoría gramatical a la que 
pertenecen, esto es, si son nombres, adjetivos, verbos, etc. En psicolingúística, una de las 
variables más importantes es la frecuencia de uso, es decir, la frecuencia con que se utiliza 3 
cada palabra, ya que cuanto mayor es la frecuencia de uso, más fácil resulta su 
procesamiento: tardamos menos en comprender las palabras de alta frecuencia y también 
tardamos menos en recuperarlas cuando hablamos. 

También son muy diferentes las metodologías que utilizan los lingúistas y los psicólogos del 
lenguaje. La lingúística emplea el método racional, consistente en reflexionar sobre 
materiales verbales (p. ej., tratando de descubrir las reglas que rigen una lengua), mientras 
que la psicología del lenguaje usa el método científico (observación y experimentación) para 
recoger datos empíricos y verificar hipótesis sobre el uso del lenguaje por parte de las 
personas. 

Además, la lingiiística parte de materiales verbales que han sido producidos en situaciones 
ideales, por ejemplo frases perfectamente gramaticales, mientras que la psicolingúística parte 
de materiales que han sido producidos en situaciones reales, con todos sus defectos y errores. 
La psicolingúística trata de conocer cómo se van produciendo o comprendiendo esos 
materiales, momento a momento desde que se inicia el proceso hasta que se termina, y la 
ayuda de algunas metodologías conductuales y fisiológicas son clave para estos estudios en 
línea. Dicho en términos coloquiales, a los lingiúistas les interesa el lenguaje como un 
producto acabado, externo a quien lo ha generado. A los psicólogos del lenguaje nos interesa 
el proceso que ha dado lugar a ese producto. No tanto el pastel terminado, recién salido del 
horno, sino el proceso de su fabricación, todo lo que «se cuece» antes de su salida. 

A pesar de las grandes diferencias que nos separan de la lingúística debemos mantener 
estrechas relaciones con esta disciplina, ya que nos proporciona valiosa información sobre 
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los componentes del lenguaje, que es básica para poder enfocar nuestros estudios. Si no 
tenemos claro qué es un fonema o un morfema o cuáles son las reglas que rigen las 
estructuras sintácticas, difícilmente podremos realizar buenas investigaciones sobre el 
procesamiento del lenguaje. De hecho, dada la complejidad del procesamiento lingúístico, 
existen especializaciones dentro de la psicolingúística, de manera que algunos investigadores 
se dedican a estudiar la forma en que identificamos los fonemas en la fase inicial de 
percepción del habla, otros al reconocimiento de las palabras y el acceso a su significado, 
otros al procesamiento sintáctico en la comprensión de oraciones, otros a la comprensión del 
discurso, etc. (Recuadro 1-2). 


Recuadro 1-2. COMPONENTES DEL LENGUAJE 

De la misma manera que un químico examina los compuestos para descubrir sus moléculas, 
los lingúistas analizan el lenguaje para descomponerlo en sus componentes más simples 
(Jay, 2003). El lenguaje está organizado en una jerarquía de componentes de distinta 
complejidad. Los que se describen a continuación son los principales componentes, 
empezando desde los más simples (fonemas) hasta las unidades mayores (discurso). 
Fonemas 

Se trata de la unidad más pequeña que establece distinciones de significado en una lengua. 
Así, las palabras «pala» y «bala» se diferencian en el primer fonema (/p/ frente a /b/) y esta 
pequeña distinción da lugar a dos significados completamente distintos. No hay que 
confundir los fonemas, que son unidades abstractas, con los fonos o sonidos fonéticos, que 
son las realizaciones acústicas de cada fonema. 

Dos sonidos fonéticos pueden constituir fonemas distintos en una lengua, o pertenecer a un 
único fonema en otra lengua. Por ejemplo, en castellano existe un único fonema fricativo 
alveolar, /s/, que generalmente se pronuncia de forma sorda, sin participación de las cuerdas 
vocales. En catalán, en cambio, hay dos fonemas: /s sorda/ (sin intervención de las cuerdas 
vocales) y /s sonora/ (con intervención de las cuerdas vocales), y existen palabras que se 
diferencian entre sí sólo por ellos. Así, «sortir de caca» («caca» pronunciada con s sorda) es 
salir de caza, y «sortir de casa» («casa» pronunciada con s sonora) es salir de casa, del 
hogar. La s castellana se considera un fonema sordo, pero ¿quiere decir esto que los 
castellanos no pronuncian la s sonora en el lenguaje habitual? Hay múltiples ejemplos en 
que la s castellana se pronuncia sonora: fíjese el lector en la pronunciación de la s en «ahora 
mismo» dicho de forma rápida y natural. Por lo tanto, en castellano pronunciamos s sorda 
(la mayoría de las veces, como en «Sapo», «soso», etc.) y también s sonora. La diferencia 
con el catalán reside en que no constituyen dos fonemas distintos, sino dos variantes 
acústicas de un único fonema (/s/). Es decir, no existen dos palabras castellanas que se 
diferencien, como en catalán, en que una tenga s sorda y la otra s sonora. 

El castellano tiene un total de 24 fonemas: 5 vocales más 19 consonantes, pero esta cifra 
varía en las diferentes lenguas. Hay idiomas, como el polinesio, que sólo tienen 11 fonemas 
(6 consonantes y 5 vocales) o el amazónico Piraha (8 consonantes y 3 vocales) y los hay que 
llegan a 141, como ocurre con !Xu (117 consonantes y 24 vocales) hablado por los 
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bosquimanos en Namibia y otras áreas próximas. El tamaño típico del inventario fonémico 
está entre 20 y 37 fonemas, donde se sitúa el 70% de las lenguas. La media se halla en torno 
a 31 fonemas. En consecuencia, el castellano está por debajo del promedio, pero dentro del 
tamaño típico. 

En general, las vocales son más escasas que las consonantes, y su número es algo menos de 
la mitad de éstas (40% como media). Hay, no obstante, una variabilidad importante a través 
de las lenguas. El número más frecuente (moda) es el de 5 vocales, como sucede en lenguas 
tan distantes como el castellano o el japonés. 

Palabras (morfemas) 

El siguiente componente en la jerarquía del lenguaje está constituido por las palabras o, para 
ser más exactos, los morfemas, que son las unidades más pequeñas cargadas de significado. 
Los morfemas no sólo incluyen raíces de palabras, sino también prefijos y sufijos. En aras 
de la simplicidad, nos centraremos en el concepto intuitivo de palabra. 

Cualquier persona de cultura media conoce varias decenas de miles de palabras, y el número 
de palabras de un idioma se cuenta en cientos de miles. El diccionario de la R.A.E. (23* 
edición) tiene un total de 195.439 acepciones. Todas las lenguas tienen dos clases 
diferenciadas de vocabulario: palabras de contenido (sustantivos, adjetivos, verbos y 
algunos adverbios) con significado pleno, y palabras de función, o functores, 
(determinantes, preposiciones, conjunciones, modificadores, verbos auxiliares, etc.), que no 
tienen contenido semántico pleno, pero modifican las relaciones de significado de las 
primeras. 

Ambos tipos de palabras son necesarias y cumplen funciones diferentes: los functores son 
esenciales para formar la estructura sintáctica de la oración, y las palabras de contenido para 
aportar la información. La distribución de ambos vocabularios es muy desigual: las palabras 
de contenido son miles y forman una clase abierta que incorpora continuamente nuevos 
vocablos. Las de función constituyen una clase cerrada, un «club selecto» que apenas 
admite nuevos fichajes (¿cuántos siglos se necesitan para añadir una nueva conjunción o un 
determinante?). Estas últimas son muy pocas, pero, por otra parte, son de uso muy frecuente 
en el lenguaje. 

Oraciones (sintaxis) 

La sintaxis se refiere a un nivel de organización superior que permite combinar las palabras 
para formar oraciones. En realidad, las oraciones constituyen la verdadera unidad de 
significado del lenguaje humano. Nadie emplea simplemente una palabra para comunicarse, 
sino que, como mínimo, realiza un acto predicativo, dice algo sobre algo, y esto sucede en la 
oración. 

Todas las lenguas del mundo se basan en la oración como elemento clave de comunicación, 
y en todas ellas la oración básica se compone de una estructura binaria formada por un 
sintagma nominal y un sintagma verbal. El sintagma nominal contiene al menos un nombre, 
que es generalmente el sujeto de la oración, y el sintagma verbal contiene al menos un verbo 
y actúa como predicado de la oración. 
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Todo hablante es capaz de discriminar si una serie de palabras forman una oración gramati- 
Calmente correcta en su lengua. De hecho, los lingiiistas se valen de esto para inferir la 
gramática de una lengua nueva que pretenden conocer, a través de preguntas a los hablantes 
nativos. De los dos ejemplos siguientes, cualquier castellanoparlante sabe que el primero, 
aunque sea absurdo y contradictorio, constituye una oración posible (gramatical) en el 
idioma, mientras que el segundo no lo es: 

e Las blancas calamidades gritaron silenciosamente. 

e Los desde estropeó cuando piedras el mismo. 
Es incluso posible extraer la estructura sintáctica de una oración sin conocer el significado 
de las palabras. En el siguiente ejemplo, tomado de Belinchon et al. (1992), tenemos una 
«oración» formada por «palabras» inventadas: 

e Los opilorios escrandaron fildamente a los plandiscos avistosos. 
Si nos preguntan por el sujeto, no tenemos la menor duda: los opilorios; el resto es el pre- 
dicado. Podemos montar la estructura sintáctica completa de esta «oración». También 
podemos establecer sus propiedades morfosintácticas: «opilorios» y «plandiscos» son 
sustantivos comunes, «escrandaron» pertenece al verbo «escrandar» de la primera 
conjugación (yo escrando, tú escrandas, él escranda, nosotros escrandamos...), «fildamente» 
es un adverbio de modo, «avistosos» es un adjetivo calificativo masculino plural. Sin 
necesidad de consultar significados en nuestro léxico mental, el lenguaje suministra 
suficientes pistas -palabras de función y terminaciones- para poder construir la estructura 
sintáctica. 
Discurso 
El discurso, o texto en el lenguaje escrito, es el nivel más alto de organización del lenguaje. 
Se sitúa en un plano supraoracional, que implica varias oraciones, pero no es simplemente la 
suma de ellas. Para que formen un discurso es necesario que esas oraciones mantengan una 
unidad de sentido o coherencia. Veamos los siguientes ejemplos tomados del libro de 
Manuel de Vega (de Vega, 1984): 
Luis fue a la fiesta de cumpleaños de Pedro. Pedro abrió sus regalos. Luis comió la tarta y se 
fue. 
Luis fue a la fiesta de cumpleaños de Pedro. Pedro estudió la carrera de farmacia. Luis pesa 
80 kilos. 
En ambos casos hay tres oraciones, pero sólo en el primero se puede hablar de texto 
coherente. En el segundo ejemplo cada una de las frases es comprensible, pero no hay 
coherencia entre ellas y, por lo tanto, no forman un discurso. Además de la coherencia, hay 
otros fenómenos específicos que emergen en el discurso, como son las inferencias; es decir, 
las piezas de información que no están explícitas en el texto y que el lector debe añadir para 
que haya coherencia. Por ejemplo, consideremos el siguiente microtexto: 
El policía disparó al delincuente que había secuestrado a la cajera. Éste recibió una herida en 
el hombro. 
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El lector con seguridad infiere muchos detalles, basándose en el propio texto, pero también 
en su conocimiento del mundo. Por ejemplo, el policía disparó con una pistola, quien resultó 
herido fue el ladrón (no el policía), la herida en el hombro la produjo el disparo del policía, 
etcétera. 

Otra peculiaridad del discurso es que, dada su complejidad, es obligado que el lector/oyente 
gestione inteligentemente sus recursos cognitivos (p. ej., la memoria de trabajo), con el fin 
de construir y recordar el sentido general del texto sin perderse en los detalles. Es decir, 
dirigiendo el foco de atención sucesivamente a diferentes ideas del texto, pero también 
extrayendo las ideas principales y manteniéndolas en la memoria. 


Sin duda alguna, la lingiiística ha tenido una influencia especial en el origen y desarrollo de 
nuestra disciplina. Pero hay otras disciplinas con las cuales la psicología del lenguaje tiene 
estrechos vínculos, como la sociolingúística, interesada en conocer cómo varían las formas 
lingúísticas en los distintos grupos sociales o cómo influye el lenguaje en la interacción 
social. También sus métodos de investigación son diferentes, puesto que están basados fun- 
damentalmente en la observación. Sin embargo, de nuevo, sus conocimientos son útiles a la 
hora de preparar nuestros estudios sobre el procesamiento del lenguaje porque deberíamos 
tener en cuenta las características socio-demográficas de los participantes (edad, nivel 
cultural, estrato social, etc.) que en cada caso utilizamos en nuestros estudios, ya que los 
resultados encontrados en una población determinada podrían no ser generalizables a otras 
poblaciones. 

Asimismo, son estrechos los vínculos con las disciplinas médicas que estudian los aparatos y 
órganos que intervienen en el lenguaje, especialmente la foniatría -que estudia el aparato 
fonador (laringe, faringe, cuerdas vocales, boca, etc.)-, que nos permite pronunciar los 
sonidos del habla, o la neurología, que estudia el cerebro, responsable de toda nuestra 
actividad cognitiva, incluido el lenguaje, así como las ciencias computacionales, 
especialmente la inteligencia artificial, que tratan de simular y, quizás en el futuro, emular 
las capacidades lingilísticas de los seres humanos. 


DESARROLLO HISTÓRICO DE LA PSICOLOGÍA DEL LENGUAJE 

Aunque siempre es difícil precisar la fecha de nacimiento de una disciplina, en el caso de la 
psicología del lenguaje o psicolinguistica hay consenso en situar esa fecha a principios de los 
años cincuenta, cuando un grupo de psicólogos y lingiistas se reunieron para discutir acerca 
de sus respectivas relaciones. La primera reunión se celebró en 1951 en la Universidad de 
Cornell, y la segunda dos años después, con un grupo mayor de participantes, en la 
Universidad de Indiana. Con las aportaciones de este segundo seminario, dos de los 
organizadores, el psicólogo Osgood y el lingúista Sebeok, publicaron un libro un año más 
tarde con el título Psycholinguistics. A survey of theory and research problems. Para muchos 
investigadores, la publicación de este libro en 1954, donde aparece por primera vez el 
término psicolingúística, se considera como fecha de nacimiento de la disciplina. 
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¿Por qué apareció justo en ese momento y en ese lugar? Fundamentalmente porque ni los 
psicólogos ni los lingiiistas norteamericanos de los años cincuenta estaban muy satisfechos 
con el marco teórico en el que trabajaban ni tampoco con las herramientas que utilizaban y 
buscaban en otros ámbitos información que les permitiese ampliar sus horizontes. Pero vea- 
mos qué había ocurrido en los años anteriores, porque antes de que surgiese como disciplina 
científica hubo muchos trabajos, desde distintas perspectivas, dedicados a la psicología del 
lenguaje. 
e Antecedentes 

Podemos asegurar que, en realidad, los estudios de psicología del lenguaje se iniciaron en el 
mismo momento en que comenzó la psicología científica, allá por el año 1879, con la 
creación del primer laboratorio de psicología experimental en Leipzig, Alemania, por parte 
de Wilhelm Wundt, que supuso la separación definitiva de la filosofía. Profesor de medicina, 
de sólida formación fisiológica, Wundt definió la psicología como la ciencia de la vida 
mental. Para él era posible investigar los fenómenos mentales, como sensaciones, 
sentimientos, imágenes, pensamientos, etc., empleando procedimientos rigurosos como los 
usados en las ciencias naturales. Ya no se trata de conjeturar filosóficamente desde un 
despacho, sino de ir al laboratorio y obtener datos empíricos de la realidad mental que se 
quiere conocer. 
Wundt concedió gran importancia al estudio del lenguaje porque estaba convencido de que 
éste arrojaba luz sobre la naturaleza de la mente humana. De hecho, Blumenthal lo describe 
como el maestro psicolingiista porque escribió extensamente sobre muchos aspectos del 
lenguaje: fonología, gramática, producción y comprensión del lenguaje, desarrollo del 
lenguaje en los niños, lectura, lenguaje de los signos y otros temas. Desarrolló una teoría 
sobre la producción del lenguaje, basada en el concepto de oración. Para Wundt es la oración 
-y no la palabra- la unidad primaria del lenguaje. No es posible pronunciar varias palabras a 
la vez, por lo que el lenguaje exige la ordenación secuencial en el tiempo de los elementos 
lingúísticos (palabras, sonidos, etc.). Wundt considera la producción del lenguaje como el 
proceso de transformación desde un pensamiento completo y unitario a una secuencia 
organizada de segmentos de habla: 

La oración [...] no es una imagen que discurre con precisión a través de la 

conciencia, donde cada palabra o cada sonido aparecen sólo momentáneamente, 

mientras los elementos previos y siguientes desaparecen de la conciencia. En su 

lugar, permanece como un todo en el nivel cognitivo mientras se está hablando. Si 

esto no fuera así, perderíamos irrevocablemente el hilo de lo que se habla. (Wundt, 

1912, citado en Blumenthal, 1970.) 
Para Wundt, el habla tiene su origen en la apercepción de una impresión general de la 
conciencia. Después, a través de un procedimiento de análisis, el hablante descompone esta 
apercepción global en distintos componentes y, al mismo tiempo, identifica las relaciones 
que hay entre ellos, como las de sujeto y predicado. En el proceso recíproco de comprensión 
del lenguaje, el oyente reconstruye la impresión general a partir de la secuencia de elementos 
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que constituyen la oración. A su vez, lo importante para el oyente es esta impresión general, 
no la organización superficial de los elementos desde los que se ha derivado. Por eso, el 
oyente recuerda el significado de lo que oye, aunque olvida pronto las palabras exactas de la 
oración. Con esta visión, Wundt sienta las bases de algunos conceptos contemporáneos 
como, por ejemplo, la noción de estructura superficial y estructura profunda del lenguaje que 
Chomsky propondría años más tarde. También realizó estudios empíricos utilizando el 
método introspectivo consistente en intentar observar las operaciones mentales que uno 
mismo realiza mientras lleva a cabo una actividad. 

Durante las primeras décadas del siglo XX se impuso el conductismo como paradigma 
dominante o corriente principal en los ámbitos académicos y científicos de la psicología. 
Este enfoque reaccionó vigorosamente contra el empleo de la introspección como método de 
estudio, por subjetivo y poco fiable, y abordó sólo aquello que se podía medir y observar 
objetivamente, es decir, la conducta o comportamiento. Desde su aparición, hacia 1920, 
hasta los años cincuenta, se hace hincapié en el análisis de las relaciones entre los estímulos 
y las respuestas de los organismos, principalmente animales (ratas, palomas), y desde aquí se 
generalizó a los seres humanos, en la medida en que los principios básicos del aprendizaje 
son comunes. El conductismo supuso un avance en la psicología como ciencia objetiva y 
rigurosa, pero adoleció de limitaciones importantes que pronto se pondrían de manifiesto. Su 
alergia a abordar cualquier cosa que no fuera directamente observable llevó a los 
conductistas a desdeñar el estudio de cualquier proceso mental y, entre ellos, los que tenían 
que ver con el lenguaje. Se concebía el lenguaje, o mejor dicho la «conducta verbal», como 
preferían denominarlo, con el mismo enfoque que los restantes comportamientos. Skinner, en 
su conocido libro de 1957, Verbal behavior (Conducta verbal, publicado en castellano por 
Trillas, 1981), trataba el lenguaje como una respuesta a los estímulos del entorno que podía 
ser condicionada y reforzada por sus consecuencias. Dejaba de lado, así, los aspectos 
nucleares que tienen que ver con los procesos y las representaciones mentales subyacentes al 
lenguaje. 

Algunos trabajos conductistas demostraron que se podría reforzar diferencialmente el uso de 
ciertas palabras frente a otras. El hecho de que un entrevistador refuerce con sonidos como 
«mmm», u otros signos sutiles de aprobación, un tipo determinado de palabras (p. ej., 
plurales frente a singulares), hacía aumentar la probabilidad de que el entrevistado usara tales 
palabras, incluso sin ser consciente de ello (Greenspoon, 1955). 

En cualquier caso, la época conductista sirvió para consolidar a la psicología como una 
ciencia empírica exigente con el método científico y contribuyó a pulir las herramientas 
metodológicas de la investigación. Por otra parte, las nuevas teorías ampliaron su campo de 
actuación más allá del estrecho margen estímulo-respuesta, incorporando otros conceptos no 
observables aunque sí susceptibles de ser probados de forma empírica. También es justo 
reconocer que si bien la influencia del enfoque conductista en el plano teórico de la 
psicolingiíística fue reducida, su repercusión en el ámbito aplicado ha sido mayor, 
especialmente en la elaboración de programas de entrenamiento lingúístico tanto en la 
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enseñanza de segundas lenguas, como en el tratamiento de trastornos graves del lenguaje, 
autismo o deficiencia mental (Lovaas, 1977). 

En la década de los años cincuenta se produjo un cambio de paradigma desde el conductismo 
a la psicología cognitiva, lo cual propició la aparición de la psicología del lenguaje. Así 
como los años treinta y cuarenta se caracterizaron por ser un período poco fructífero para la 
psicología del lenguaje debido al dominio conductista y también porque la Segunda Guerra 
Mundial desplazó los recursos y el interés hacia otras prioridades, el paso a la segunda mitad 
del siglo XX coincidió con profundos cambios que llevaron a la psicología hacia su 
configuración actual, en la que nuestra disciplina encaja perfectamente. Jóvenes psicólogos, 
recién salidos de las universidades, como George Miller y otros, reaccionaron contra el 
conductismo oficial y apostaron por una nueva psicología capaz de abordar los procesos 
mentales conservando una metodología científica y rigurosa. Las causas del cambio 
paradigmático se sitúan en una serie de factores que confluyeron a partir de los años 
cincuenta. En su origen se hallan la crisis y el agotamiento del conductismo como 
consecuencia de sus propias limitaciones, al dejar fuera de su foco lo más interesante: los 
procesos mentales. Muchos investigadores conductistas que trabajaban con sujetos humanos 
utilizando estímulos verbales se dieron cuenta de las limitaciones de su enfoque. Este grupo, 
denominado de aprendizaje verbal, era altamente productivo, ya que realizó múltiples 
experimentos y recogió numerosos datos de respuestas verbales ante determinados estímulos 
también verbales. Las dos tareas más utilizadas eran la de aprendizaje serial y la de 
aprendizaje de pares asociados. La tarea de aprendizaje serial consistía en presentar un 
conjunto de estímulos, generalmente sílabas sin sentido para un mayor control experimental, 
que los sujetos tenían que repetir tal cual y en el mismo orden en el que se habían 
presentado. En el aprendizaje de pares asociados se presentaban listas de pares de estímulos 
para que, al presentar posteriormente uno de ellos, los sujetos intentasen recordar el otro. En 
estos experimentos se manipulaban todas las variables posibles de los estímulos: longitud de 
las listas, tiempo de exposición de los estímulos, intervalos entre el aprendizaje y el 
recuerdo, etc. Con tanto experimento, a principios de los años cincuenta se había acumulado 
una enorme cantidad de datos referentes a las sílabas sin sentido que animaron a muchos 
investigadores a comenzar a trabajar con las palabras. Este paso supuso un cambio 
considerable, ya que había que controlar muchas nuevas variables, como el tipo de palabra, 
el significado, la frecuencia de uso, etc., y para manejar algunas de estas variables era 
conveniente pedir información a los lingiistas. El salto de la sílaba a la palabra suponía 
entrar en un mundo nuevo donde se necesitaba asesoramiento, y los lingilistas podían 
proporcionar esa información. Por otra parte, muchos de los psicólogos conductistas 
empezaban a preguntarse para qué servían realmente tantos datos acumulados. Las 
generalizaciones que podían extraerse a partir de esos datos eran demasiado limitadas y 
comenzaba a sentirse la necesidad de contar con un marco teórico más amplio en el que 
poder organizar toda la evidencia empírica. 
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También hubo factores externos que propiciaron el cambio paradigmático. Especialmente 
decisiva fue la poderosa influencia que ejerció la teoría de la comunicación formulada por 
Shannon en 1948 y, sobre todo, la revolución tecnológica que supuso la aparición de los 
ordenadores. Al finalizar la Segunda Guerra Mundial, los ingenieros dispusieron de la 
posibilidad de construir máquinas de un nuevo tipo: en lugar de ampliar la fuerza o actividad 
física, como los motores, éstas amplían la actividad mental ejecutando cálculos con extraor- 
dinaria rapidez y exactitud. Además, las muevas máquinas no sólo eran grandes 
«masticadoras de números», sino que también eran capaces de manejar información 
simbólica y demostrar teoremas matemáticos. Los ordenadores proporcionaron a la 
psicología una poderosa analogía que ayudó a que ésta concibiera la mente como un sistema 
de procesamiento de información. La similitud funcional entre mente y ordenador fue el 
factor más determinante del desarrollo de la psicología cognitiva actual (de Vega, 1984). El 
ordenador como metáfora de la mente: se trata de una analogía funcional, no física. El 
ordenador consta de dos elementos diferenciados: un hardware, o circuitería de silicio, y un 
software, O programa que procesa la información. La mente tiene un «hardware» de otro 
tipo, compuesto por circuitos neuronales, pero realiza también operaciones de procesamiento 
de información. Al igual que el ordenador, el cerebro tiene sistemas de entrada de 
información, sistemas de salida y, entre ambos, sistemas que transforman y procesan esa 
información. Ambos -ordenador y mente- codifican, retienen y operan con símbolos y 11 
representaciones internas. El propio vocabulario de la psicología cognitiva se llenó de 
términos prestados de la informática y cibernética: procesos de codificación, 
almacenamiento, acceso directo, acceso secuencial, búsqueda de información, recuperación 
de información, memoria operativa o a corto plazo, memoria a largo plazo, etc. Más 
concretamente, en la psicolingiiística hablamos, por ejemplo, de procesos de «acceso léxico» 
o acceso al diccionario mental durante el reconocimiento de las palabras, etcétera. 

Hay que decir, como acotación, que hoy empieza a percibirse el agotamiento del paradigma 
cognitivo, y algunos autores anuncian la emergencia de un nuevo paradigma en un futuro no 
lejano, tal vez de la mano de las neurociencias. La analogía ordenador-cerebro, tal como se 
ha entendido hasta ahora, es demasiado simplista y no abarca una propiedad fundamental del 
cerebro: éste, al contrario que una computadora, es un sistema de procesamiento paralelo, 
masivo y muy distribuido. Cada unidad de información no se almacena localmente en 
neuronas o estructuras específicas, como hace un ordenador con sus posiciones de memoria, 
sino que se distribuye en patrones complejos de activación que involucran a millones de 
sinapsis neuronales. 

En el contexto de cambio de paradigma psicológico, el surgimiento de la psicolingúística fue 
uno de los factores que mejor contribuyó a ese cambio. Podría decirse que el lenguaje fue un 
«hueso duro» con el que tropezó el conductismo. Su extraordinaria complejidad difícilmente 
permitía abarcarlo desde una óptica tan simple como la basada en la relación estímulo- 
respuesta. Esta había rendido valiosos servicios al desvelar importantes leyes y principios 
generales del aprendizaje, pero era manifiestamente insuficiente para entender una conducta 
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tan compleja como la lingúística. El lenguaje reclamaba, como ninguna otra conducta 
humana, el uso de conceptos como representaciones internas y procesos mentales si se quería 
empezar a entenderlo en toda su magnitud. 
Fue en ese marco en el que se realizó el seminario de verano en la universidad de Cornell, en 
1951, que sirvió de lugar de encuentro interdisciplinar entre psicólogos y lingúistas, lo que 
originó el nacimiento oficial de la actual psicología del lenguaje o psicolingúística. Su 
objetivo principal era, como describió Michael Tanenhaus, años más tarde: 

[...] diseñar una agenda de investigación psicolingúística que reflejara un consenso 

entre los participantes, de manera que las herramientas metodológicas y teóricas 

desarrolladas por los psicólogos pudieran ser usadas para explorar y explicar las 

estructuras lingúísticas que iban descubriendo los lingiiistas (Tanenhaus, 1988, p. 4). 
Poco después de esos primeros encuentros entre psicólogos y lingiiísticas -en los que tra- 
zaron las directrices por las que debía discurrir la nueva disciplina- se produjo un hecho cru- 
cial que cambió totalmente el panorama y fue la publicación en 1957 del libro Syntactic 
structures de Noam Chomsky, uno de los lingúistas más influyentes del siglo XX (Chomsky, 
1957, publicado en castellano en 1974). En él plantea su gramática transformacional y sienta 
las bases para una estrecha colaboración entre psicólogos y lingitistas. Para entender la lógica 
interna del lenguaje, Chomsky plantea la existencia de una estructura profunda que, a través 
de un conjunto de transformaciones, se convierte en una estructura superficial, que es la que 
aflora en las palabras y frases que pronuncia el hablante. El oyente, en cierto modo, 
recorrería el camino inverso: partiendo de la estructura superficial de la frase llega a la 
estructura profunda. Su modelo gramatical tenía una fuerte base psicológica y constituyó una 
fuente de hipótesis que los psicólogos pusieron a prueba a través de numerosos experimentos 
durante las dos décadas siguientes. Chomsky fue muy crítico con los enfoques sobre el 
lenguaje de su época. En 1959 efectuó una crítica demoledora del libro de Skinner, en lo que 
se ha denominado el debate Skinner-Chomsky, que se describe a continuación. Hay que 
decir que, con el tiempo, los planteamientos de Chomsky fueron sufriendo diversos cambios 
hasta llegar a su actual programa minimalista (Chomsky, 1995, 2000), centrado en el 
concepto clave de la recursividad sintáctica (Hauser, Chomsky y Fitch, 2002). 

e El debate Skinner-Chomsky 

La explicación del lenguaje desde el conductismo y, más concretamente, desde el 
condicionamiento operante tiene su mejor representante en la figura de Skinner (véase en 
castellano, Bayés, 1980). Burrhus F. Skinner (1904-1990), uno de los autores más destacados 
del conductismo, llevó los postulados conductistas sobre el lenguaje a su extremo más 
radical, fundamentalmente por dos vías: por una parte, negando la validez psicológica, por su 
carácter mentalista y poco objetivo, de los conceptos mismos de lenguaje, símbolo o 
significado, y proponiendo su sustitución por el más genérico de conducta verbal y, por otra 
parte, negando la validez de toda explicación psicológica de la conducta verbal más allá de 
los estímulos y las respuestas. Es decir, cualquier explicación habría de basarse 
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necesariamente en el análisis funcional de las respuestas de los sujetos y de las contingencias 
de refuerzo determinadas por el ambiente. 

Esta concepción se recoge en su libro Verbal behavior (Conducta verbal), cuya redacción 
comenzó, al parecer, en 1932 y cuya primera edición apareció más de 20 años después 
(Skinner, 1957). En este libro el autor trata de demostrar que toda habla humana puede ser 
atribuida al condicionamiento de los hablantes por su ambiente. Entiende el lenguaje como 
un conjunto de operantes verbales o respuestas verbales del sujeto, adquiridas por mero 
condicionamiento. Pretende explicar el lenguaje como un conjunto de hábitos que se van 
formando durante la vida, sin necesidad de apelar a complejos mecanismos innatos o 
mentales. Lo único que hace falta es la observación sistemática de los sucesos que acontecen 
en el mundo exterior y que llevan al hablante a articular sonidos. 

No hay que olvidar que Skinner, profesor de Harvard, es uno de los autores más eminentes 
de la psicología contemporánea, cuya obra experimental sobre las leyes del 
condicionamiento y el comportamiento de los animales en situaciones de estricto control es 
impresionante y no admite impugnación. Por ejemplo, su libro Programas de reforzamiento 
(Ferster y Skinner, 1957) recoge en sus 735 páginas y 921 figuras los resultados obtenidos en 
más de 70.000 horas de trabajo experimental sobre el aprendizaje por condicionamiento en 
palomas. Lo criticable en él es, en todo caso, su extrapolación directa a la conducta humana 
en general, y particularmente a una conducta de una complejidad tan extraordinaria como la 
lingúística. 

Sus explicaciones sobre el lenguaje se basan en trabajos sobre ratas y palomas. Había 
logrado demostrar que, con tiempo suficiente, se podía adiestrar a estos animales en la 
ejecución de una enorme variedad de tareas en apariencia muy complicadas (p. ej., tocar una 
melodía en un piano), siempre y cuando se siguieran dos principios elementales: primero, las 
tareas debían descomponerse en una serie de pasos cuidadosamente graduados, y segundo, 
había que recompensar repetidamente a los animales en la medida en que sus respuestas se 
aproximaban a las deseadas. 

En un experimento típico se coloca una rata en una caja que contiene una palanca (caja de 
Skinner); cada vez que la rata presiona la palanca, se le recompensa con una bolita de 
comida. Al principio la rata descubre de manera fortuita esta relación funcional entre su 
respuesta (apretar la palanca) y el estimulo reforzador, o refuerzo (comida), pero después de 
cierto número de ensayos, el animal llega a aprender que si tiene hambre puede obtener el 
alimento presionando la palanca. Una vez adquirida una respuesta como ésta, la situación se 
puede complicar un poco más, de modo que el animal sólo obtiene la comida si está presente 
un determinado estímulo (p. ej., una luz roja), que actúa como estímulo discriminante. Esta 
clase de aprendizaje se basa en el condicionamiento operante, o respuestas voluntarias que 
son reforzadas. Se puede estudiar, además, la «fuerza» de una respuesta a través de su 
permanencia en situaciones de extinción, es decir, cuando ya no se dispensa el refuerzo. 
También se estudia qué secuencias o programas de refuerzos son más apropiados para 
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conseguir una conducta nueva de la forma más rápida posible, y cuáles son más idóneos para 
que ésta se haga estable y resistente a la extinción. 
Según Skinner, gracias a estos mecanismos es como se produce la inmensa mayoría del 
aprendizaje humano, incluido el aprendizaje del lenguaje. Respecto al lenguaje, lo único que 
hace falta es identificar las variables controladoras que nos permiten predecir ciertos 
enunciados lingúísticos. Por ejemplo, así como es posible afirmar que la conducta de la rata 
de apretar una palanca se halla parcialmente «bajo el control de una luz encendida», también 
puede decirse que una sensación de hambre puede «controlar» o predecir la emisión de una 
frase como «Por favor, pásame el pan y la mantequilla», o la presencia de un bello cuadro 
puede «controlar» y provocar la exclamación «¡Oh, qué bonito!», o que un mal olor nos 
puede llevar a decir «¡Qué mal huele!». Conceptualmente, la explicación skinneriana de la 
conducta verbal se asienta en la descripción de las secuencias de estímulos y respuestas. De 
acuerdo con su valor funcional, Skinner clasifica las unidades de conducta lingúística en 
varios tipos, como comportamientos repetitivos, textuales, intraverbales, etc. (para más 
detalles, véase Bayés, 1980). 
Por otra parte, como se ha señalado anteriormente con respecto al conductismo, la aportación 
de Skinner a la psicología del lenguaje se ha dejado sentir más en el ámbito aplicado, gracias 
al diseño de programas de adiestramiento lingitístico para la enseñanza de segundas lenguas, 
o el tratamiento de problemas severos del lenguaje. 
Dos años después de la publicación de Verbal behavior, el entonces joven y brillante 
lingúista Noam Chomsky escribe una crítica muy dura a la posición de Skinner en su artículo 
Review of B.F Skinners Verbal behavior publicado en el volumen 35 de la revista Language 
(Chomsky, 1959; véase Bayés, 1980). Chomsky sostiene que las secuencias sencillas y bien 
definidas de sucesos que ocurren en las cajas de las ratas y palomas sencillamente no pueden 
aplicarse al lenguaje humano, y que la terminología empleada en esos experimentos no 
puede extrapolarse sin más al ámbito lingiístico, sin incurrir en una extrema vaguedad. Gran 
parte de la crítica de Chomsky se asienta en la enorme creatividad o productividad del 
lenguaje. La mayor parte de las oraciones que dice un hablante, o que escucha un oyente, son 
nuevas gracias a esta propiedad clave del lenguaje humano. George A. Miller estimó en unos 
100 quintillones el número de frases de 20 palabras que podrían construirse correctamente en 
inglés y ser, en principio, emitidas y comprendidas por hablantes del idioma. Cualquier 
hablante distingue sin esfuerzo si una secuencia de palabras constituye una oración correcta 
o no en su idioma y, al mismo tiempo, es poco probable que se haya enfrentado -y 
condicionado- a ella con anterioridad. Por otra parte, la variedad de «estímulos» que podrían 
estar asociados al lenguaje es impredecible. El siguiente es un fragmento del artículo de 
Chomsky: 
Según Skinner, un ejemplo típico de «control por el estímulo» sería la respuesta 
consistente en pronunciar Mozart ante un fragmento musical, o la respuesta holandés 
ante un cuadro. Afirma que estas respuestas están «bajo el control de propiedades 
extremadamente sutiles» del objeto físico o del hecho. Supongamos que en vez de 
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decir holandés decimos Desentona con el papel de la pared, Creía que te gustaba el 
arte abstracto, Nunca lo había visto, Está inclinado, Está colgado demasiado bajo, 
Precioso, Horrible, ¿ Te acuerdas de cuando fuimos de camping el verano pasado”, o 
cualquier otra cosa que nos pudiera venir a la mente cuando miramos el cuadro [...] 
Si miramos una silla roja y decimos rojo, la respuesta está bajo el control del estímulo 
«rojez»; si decimos silla está bajo el control del conjunto de propiedades [...] que 
caracterizan la «silliedad», y de forma semejante para cualquier otra respuesta [...]. 
Pero usando la palabra «estímulo» de esta forma ha perdido toda su objetividad [...]. 
No podemos predecir el comportamiento verbal en términos de los estímulos del am- 
biente del hablante, puesto que no sabemos cuáles son los estímulos en cuestión hasta 
que él responde (Chomsky, 1959; pp. 32-33 de la traducción castellana). 
En general se considera que la crítica de Chomsky fue un durísimo golpe al planteamiento 
radical conductista sobre el lenguaje. Sin embargo, algunos autores entienden que se ha 
magnificado excesivamente el impacto de esta crítica y acusan a Chomsky de no haber 
comprendido en toda su profundidad algunos de los planteamientos skinnerianos. Bien es 
cierto que la crítica chomskiana no recibió respuesta por parte de Skinner, lo que contribuyó 
a acrecentar esta sensación de fuerza demoledora, unida al hecho de que, incluso en inglés, 
ha tenido mucha más difusión el artículo de Chomsky que el libro de Skinner. Muchos 
fueron los que se sumaron a las críticas, deslumbrados por la brillantez de Chomsky, sin 
haber leído dos líneas de la obra skinneriana. Años después no faltaron algunas voces que se 
alzaron en defensa de Skinner o, al menos, en apoyo de algunos de sus planteamientos, como 
es el caso de Kenneth MacCorquodale, y recogieron el guante mostrando, a su entender, la 
debilidad de algunos de los argumentos esgrimidos por el lingiiista. 
A todo ello se ha añadido cierto malestar por el tono y el estilo hiriente bastante habitual en 
Chomsky. Así, Bayés (1980), en su introducción, dice: «En nuestra opinión, los juicios 
bruscos, teñidos de emotividad, de Chomsky, se encuentran bastante alejados del modelo de 
crítica científica, respetuosa hacia los autores pero implacable con los errores -que es preciso 
no tanto denunciar como demostrar» (p. 10). MacCorquodale (1970) se queja de que 
«probablemente, la razón de más peso por la que nadie ha replicado a la crítica es su tono. Es 
duro hasta la ofensa; humillante, intransigente, obtuso y resentido» (p. 89 de la traducción 
castellana). Pero, en fin, éstas son cuestiones añadidas a lo que de verdad es fundamental en 
ciencia. 
e Primeros pasos de la psicolingúística 
Con Chomsky se inició un cambio profundo en la forma de concebir la psicolingiística, un 
cambio paradigmático sobre el que se articularían las investigaciones posteriores. Durante 
los años siguientes, especialmente en la década de los sesenta, la mayor parte de las 
investigaciones realizadas en el campo de la psicología del lenguaje estaban inspiradas en los 
postulados de Chomsky. Pocos fueron ya los trabajos llevados a cabo en esos años desde el 
enfoque conductista. 
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Uno de los cambios más importantes fue el de considerar la oración como la unidad funda- 
mental del lenguaje. Se abandonan los estudios de palabras aisladas para centrarse en las 
oraciones, pero no en todos los aspectos de la oración, sólo en los sintácticos, pues Chomsky 
deja fuera los contenidos semánticos y comunicativos e intenta explicar las reglas sintácticas 
por las que se rige la oración, las reglas por las que un hablante del castellano sabe que la 
oración «el perro fue atacado por el ratón» es gramaticalmente correcta (aunque 
semánticamente improbable), mientras que la oración «el perro atacado por fue el ratón» es 
gramaticalmente incorrecta. Para ilustrar que es perfectamente posible estudiar la sintaxis de 
las oraciones sin tener en cuenta su significado formuló la frase, absurda desde el punto de 
vista semántico pero correcta gramaticalmente, tan conocida por lingiiistas y psicólogos del 
lenguaje: 
Ideas verdes incoloras duermen furiosamente. 

En sus dos famosos libros Estructuras sintácticas, publicado en 1957, y Aspectos de la teoría 
sintáctica, publicado en 1965, Chomsky expuso las principales características de su nueva 
gramática, denominada gramática generativa. Algunas de esas características servirían a los 
psi-colingúistas para delimitar su campo de trabajo y encajar sus proyectos de investigación. 
Las siguientes son algunas de las características de la gramática de Chomsky que más 
influyeron en el desarrollo de la psicolingúística: 

e Chomsky hace una distinción entre lo que considera la competencia del hablante y la 
actuación real que hace del lenguaje; esta distinción será transcendental en la delimi- 
tación de los campos de la psicología y la lingúística. Competencia es el conocimiento 
que el hablante tiene de su lengua, y actuación es la puesta en práctica de esos cono- 
cimientos. De acuerdo con esta distinción, la lingúística debe ocuparse del estudio de 
la competencia, y la psicología, de la actuación. 

e Otra característica de la gramática de Chomsky es la elaboración de unas reglas que 
permiten al hablante generar un sinfín de oraciones gramaticalmente correctas aún 
cuando no las hubiese oído nunca. Estas reglas son de tres tipos: reglas de estructura 
de frase, reglas transformacionales y reglas morfofonémicas. Las reglas de estructura 
de frase se encargan de asignar etiquetas a las distintas palabras y frases para poder 
conexionarlas entre sí. Las reglas transformacionales operan sobre las oraciones ya 
formadas, unas son obligatorias, por ejemplo las que señalan la concordancia entre el 
sujeto y el verbo, y otras opcionales, como las que producen la transformación en 
pasivas, negativas, etc. Cuando se aplican sólo transformaciones obligatorias se 
producen las oraciones básicas o nucleares. Reciben este nombre porque a partir de 
ellas se generan todas las demás. Este es uno de los puntos fuertes de esta nueva 
gramática y la razón por la que se la denominó gramática generativa. Cuando se 
aplican las transformaciones opcionales se producen las oraciones complejas. 
Finalmente, las reglas morfofonémicas son las encargadas de transformar las cadenas 
terminales en la mente del hablante en los sonidos fonéticos que constituyen la oración 
hablada. 
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e Chomsky hace también una distinción entre lo que denomina estructuras superficial y 
profunda. La estructura profunda se refiere al significado que el hablante trata de 
expresar, y la estructura superficial, a la forma gramatical concreta que se utiliza para 
expresar ese significado. De esta manera, un mismo significado puede expresarse de 
varias formas gramaticales diferentes («El murciélago observaba a la serpiente», «La 
serpiente era observada por el murciélago», «Era el murciélago el que observaba a la 
serpiente», etc.). 

Los lingúistas pronto fueron persuadidos por la nueva gramática de Chomsky, ya que se 
trataba de una propuesta muy atractiva que se sustentaba en reglas claras y lógicas. Los 
psicolingiiistas, en su mayoría, también adoptaron este enfoque y dejaron de lado el estrecho 
marco conductista. La gramática generativa planteaba que los hablantes de una lengua 
debían conocer una serie de reglas que les permitiesen producir y comprender oraciones 
correctamente formadas, lo cual resultaba difícil de explicar desde la posición conductista. 
Para explicar los aspectos creativos de la conducta, la psicología conductista sólo contaba 
con los principios de generalización y transferencia, los cuales resultaban claramente 
insuficientes. Era necesario hablar de planes internos como forma básica de organizar la 
conducta, como plantearon Miller, Galanter y Pribram en 1960. Obviamente, los 
conductistas no aceptaban hablar de planes internos. 

El objetivo que se marcaron los psicolingiistas a partir de la teoría generativa fue tratar de 
comprobar la realidad psicológica de los componentes gramaticales de la teoría. Es decir, 
probar si las reglas propuestas por Chomsky para la formación de oraciones son las mismas 
que utilizan las personas cuando producen o entienden oraciones. El pionero de esta línea de 
investigación fue Miller quien, en un artículo publicado en 1962, demostró que los 
individuos tardan más tiempo en comprender oraciones que necesitan una transformación, 
por ejemplo las pasivas y las negativas, que las oraciones nucleares. Ello se debe, según 
Miller, a que para comprender una oración compleja es necesario desmontarla de sus 
transformaciones hasta llegar a la oración nuclear, y eso requiere tiempo. Así, la oración 
negativa «El perro no ladró esa noche» estaría formada por la oración nuclear «El perro ladró 
esa noche» y la regla de negación. Un año después, en 1963, Mehler comprobaba que los 
individuos recuerdan mejor las oraciones nucleares que las complejas. Muchos otros estudios 
parecían corroborar que los usuarios de la lengua utilizan las reglas propuestas por Chomsky 
en su gramática. 

Sin embargo, a pesar de la euforia inicial y los numerosos estudios realizados en esos pri- 
meros años sesenta, esta orientación no duró mucho. Desde el momento en que empezaron a 
utilizarse metodologías más perfeccionadas y se introdujo el componente semántico, los 
resultados dejaron de ajustarse a las predicciones de la gramática chomskiana. Cuando las 
oraciones negativas (y también las pasivas) se presentan dentro de un contexto adecuado en 
el que puedan cumplir su función, no son más difíciles de comprender ni de recordar que las 
oraciones nucleares. Las oraciones negativas tienen el papel fundamental de corregir 
información ya dada y también la de señalar la excepción de la norma. De esta manera, 
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cuando un hablante emite un enunciado negativo, por ejemplo, «El tren no llegó tarde hoy», 
es porque presupone que el oyente considera verdadero el enunciado afirmativo 
correspondiente: «El tren llega tarde todos los días». Es por ello que las negativas requieren 
una información previa que negar, y, si no existe esa información, como ocurría en los 
experimentos de los psicolingúistas transformacionales, que presentaban oraciones sin 
ningún contexto, las negativas no cumplen su verdadera función. Como escribían Clark, 
Carpenter y Just (1973): 
Cuando miramos un dibujo, por ejemplo de una manzana, pensamos en términos de lo 
que es —una manzana—, no en términos de lo que no es: una naranja, un senador de 
los Estados Unidos, un balón de playa, un pony indio o un contrabajo. La razón 
parece clara: una codificación positiva es una designación concisa e informativa, 
mientras que normalmente hay muchas codificaciones negativas posibles, cada una de 
las cuales contiene muy poca información (pág. 317). 
De hecho, cuando las oraciones negativas forman parte de un contexto adecuado en el que se 
utilizan para corregir información previa O para señalar la excepción de la norma, no resultan 
más difíciles de comprender que las afirmativas correspondientes (Green, 1970; Wason, 
1965). 
A finales de los años sesenta ya era ampliamente aceptada entre los investigadores la idea de 
que la oración debe estudiarse dentro de un contexto más amplio y de que el componente 
sintáctico sólo es insuficiente para explicar los procesos de comprensión y producción del 
lenguaje. En consecuencia, hacia los años setenta la mayoría de los psicolingiistas ya habían 
renunciado a esa línea de investigación chomskiana y comenzaban a incluir los componentes 
semánticos y pragmáticos. El propio Chomsky, que en principio estaba encantado de que los 
datos empíricos concordasen con su teoría, empezó a desacreditar este tipo de 
investigaciones con el argumento de que sus postulados se referían a la competencia ideal y 
no a la actuación concreta. 
A partir de este intento fracasado de trabajar conjuntamente, psicólogos y lingúistas comen- 
zaron a desarrollar sus teorías de forma autónoma, separando claramente sus campos de 
estudio. Los lingiistas se dedicaron al estudio de la competencia, centrándose principalmente 
en las restricciones universales de las gramáticas sin prestar atención a la actuación, y los 
psicólogos se dedicaron a la actuación haciendo caso omiso de la competencia. 
En los años posteriores, durante las décadas de los setenta y los ochenta, se realizaron 
numerosos estudios sobre el papel del contexto en la comprensión. En esta línea son famosos 
los experimentos de Bransford y Johnson (1973), en los que presentaban textos que parecía 
que no tenían sentido, pero bastaba un título o un dibujo para que se hiciesen perfectamente 
comprensibles. 
Por otra parte, se toma también como objeto de estudio una unidad más pequeña que la ora- 
ción: la palabra. La palabra aislada -que tiene poco interés para los lingiiistas- se convierte en 
el centro de atención de los psicolingiiistas, especialmente el reconocimiento visual de 
palabras, que ha sido -y sigue siendo- uno de los temas más investigados de la 
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psicolingúística e, incluso, de toda la psicología cognitiva. Han sido numerosos los estudios 
sobre los procesos que intervienen en el reconocimiento de palabras escritas, las variables 
que influyen en esos procesos y numerosos también los modelos propuestos para explicar los 
resultados. 

Además, el desarrollo de la psicología cognitiva en los años setenta y ochenta cambió to- 
talmente el enfoque de la psicolingúística. En esos años la psicología cognitiva consideraba 
la mente como un ordenador que percibe la información del exterior, o input, procesa esa 
información y produce un resultado o output. Los psicolingiiistas, siguiendo ese enfoque, in- 
tentaron construir modelos, generalmente basándose en «cajas» y «flechas», para explicar el 
procesamiento del lenguaje. Durante años se trabajó según esta corriente, y la mayor parte de 
los modelos psicolingúísticos utilizaron este tipo de representación. 

Como una alternativa a los modelos de cajas y flechas y de procesamiento serial, en los años 
ochenta surgieron, a partir de la inteligencia artificial, los modelos conexionistas. Estos mo- 
delos consideran que en nuestro léxico mental las palabras se encuentran conectadas entre sí 
y con las unidades subléxicas, como las sílabas o las letras, formando una especie de red. 
Algunas de esas conexiones son activadoras (p. ej., las letras «c» y «a» activan la palabra 
«Casa») y otras son inhibidoras (p. ej., las letras «c» y «a» inhiben la palabra «perro»). Entre 
los modelos más influyentes de esos años destacan el PDP (procesamiento distribuido en 
paralelo) de Rumelhart y McClelland (1981) sobre el reconocimiento de palabras escritas y ] Q 
el TRACE de McClelland y Elman (1986) sobre el reconocimiento de palabras habladas. 
Más recientemente, con el desarrollo de las técnicas de neuroimagen (resonancia magnética 
funcional, magnetoencefalografía, etc.) que permiten observar la actividad cerebral de las 
personas mientras realizan actividades lingúísticas, surgió el interés por las bases 
neurológicas del lenguaje. La psicología del lenguaje actual ya no se conforma con tratar de 
explicar los procesos cognitivos que intervienen en la comprensión y producción del 
lenguaje, sino que intenta averiguar qué mecanismos cerebrales son responsables de esas 
actividades. 


SISTEMA DE PROCESAMIENTO LINGUÍSTICO 

La psicología cognitiva concibe la mente como un sistema de procesamiento en el que la 
información de entrada es sometida a numerosas transformaciones a través de distintas 
etapas. El sistema completo, o arquitectura cognitiva, está formado por diversas estructuras O 
componentes relativamente estables que operan con representaciones internas. Aquí, el 
concepto de proceso se refiere a la actividad interna del sistema. El hecho de que los 
procesos mentales no sean directamente observables, no significa que no sean reales; no 
hablamos de entelequias metafísicas, sino de fenómenos con realidad física, que consumen 
tiempo y energía (oxígeno y glucosa). Desde el paradigma basado en la analogía o metáfora 
del ordenador, se entiende que los procesos mentales funcionan de modo semejante a las 
operaciones internas que ejecutan estas máquinas; de modo que en los procesos mentales es 
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posible identificar, al igual que en un ordenador, un conjunto finito de estados internos del 
sistema, denominados computacionales (Belinchón et al., 1992). 

Por otra parte, todo sistema de procesamiento, natural o artificial, tiene que vérselas con un 
entorno continuamente cambiante, con el que debe interactuar para su supervivencia. Ha de 
ser capaz de extraer y manejar las covariaciones o regularidades existentes en la estructura de 
los datos que proceden de dicho entorno. Su actividad interna debe llevarlo a abstraer el 
«orden» existente en el ambiente. En un entorno completamente caótico, sin ningún tipo de 
regularidad u orden, un sistema de procesamiento tendría poco que hacer. Si giro la cabeza a 
la derecha encuentro una estructura de datos visuales que guardan relación con lo que percibí 
en esa misma dirección unos segundos antes. Cuando salgo de mi casa encuentro la misma 
calle que dejé la víspera. La aprehensión de este orden no es algo exclusivo de nuestra 
especie, cualquier animal debe procesar adecuadamente el input, o datos de entrada, para 
pervivir en su medio, obtener alimento y no ser presa de otros. Si queremos que un robot se 
desenvuelva de forma autónoma, por ejemplo en la superficie marciana, también tendrá que 
procesar de forma adecuada la información del entorno y no quedar encallado para siempre 
en la primera irregularidad del terreno con que tropiece. El torrente de datos que 
permanentemente inundan a un sistema posee regularidades con las que éste (sea humano, 
animal o máquina) tiene que lidiar. Hoy sabemos que los sistemas compuestos por muchas 
unidades elementales de procesamiento, densamente interrelacionadas (como es el caso de 
los cerebros), constituyen un mecanismo especialmente apropiado para extraer -abstraer- 
invarianzas o regularidades a partir de una masa incesante y variable de datos de entrada. Las 
arquitecturas masivas que operan en paralelo y de forma distribuida son una solución 
excelente que la naturaleza ha encontrado para «capturar» la regularidad en un entorno físico 
siempre cambiante. 

Para entender el procesamiento de los datos de entrada, la psicología cognitiva postula que el 
sistema Opera sobre representaciones internas que el propio sistema genera a partir de los 
estímulos. Todo sistema cognitivo, natural o artificial, cuyo comportamiento va dirigido a 
metas ambientales debe manejar representaciones internas del ambiente. Uno de los temas 
centrales de la psicología cognitiva es conocer en qué consisten tales representaciones y cuál 
es su formato y naturaleza (véase la introducción del libro de de Vega, 1984). 

Desde el punto de vista de la psicolingúística, el interés principal se dirige hacia los procesos 
y las representaciones que se producen mientras usamos el lenguaje de las dos maneras 
posibles: produciéndolo y comprendiéndolo. Cuando quiero comunicar una idea, el sistema 
parte de esta intención inicial y de la representación mental del significado que quiero 
transmitir; inmediatamente, gracias a un complejo conjunto de transformaciones y procesos 
internos se llega a una representación fonética que, a la postre, se traduce en determinados 
movimientos musculares admirablemente orquestados. Por lo común todo esto ocurre en 
décimas de segundo. A la inversa, cuando comprendo el lenguaje, sea éste oral o escrito, la 
información del estímulo ingresa en el sistema y sufre un conjunto de transformaciones que 
culminan en una representación interna del significado. 
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Somos una especie particularmente dotada para llevar a término este trabajo; la facilidad y 
aparente ausencia de esfuerzo con que usamos el lenguaje todos los días, a todas horas, no 
debe hacernos caer en la creencia de que se trata de un tarea simple y sencilla. Detrás de esa 
aparente simplicidad se esconde todo un conjunto de procesos extraordinariamente 
complejos, ejecutados por una complicada maquinaria neural. 

A continuación, nos centraremos con más detalle en los hipotéticos procesos que se llevarían 
a Cabo mientras comprendemos el lenguaje. En la figura 1-2 se muestra un esquema general 


de los distintos pasos o etapas de procesamiento que se realizan durante la comprensión del 
habla. 


La forma en que habitualmente se representan los 
procesos u operaciones cognitivas es mediante 
cajas O elementos dispuestos en un diagrama de 
flujo, en el que la información fluye y va sufriendo 
transformaciones a su paso por las distintas etapas. 
Hay que indicar que este flujo no ha de ser 
necesariamente secuencial como se desprende del 
dibujo, ni tampoco es obligatorio que se agote un 
proceso antes de pasar al siguiente. La disposición 
gráfica obedece únicamente a su claridad 
conceptual, pero no presupone que los procesos 
sean forzosamente en serie y autoacabados. 
ce 0 El objetivo del sistema completo es que la 
información que ingresa con el estímulo 
desemboque finalmente en la construcción de una 
AAARPAR representación mental del significado. La mayor 
parte de lo que sucede mientras tanto, en ese 
esquema general de procesamiento, es opaco a 
nuestra conciencia y ocurre de forma rápida y 
automática, sin que reparemos en ello. Son precisamente los dos extremos de la cadena -la 
presencia del estímulo y la representación del significado- los elementos más accesibles 
desde nuestro nivel de conciencia. 
En primer lugar tenemos abajo el estímulo, que ingresa en la arquitectura de procesamiento 
psicolingúístico. La información acústica contenida en la onda del habla es la materia prima 
con la que se nutre el sistema. En esencia, el esquema sería semejante para otras modalidades 
de lenguaje, sea escrito (patrones gráficos) o lenguaje de signos (gestos y movimientos de las 
manos), excepto, obviamente, las primeras etapas perceptivas. 
Mediante los procesos perceptivos del habla (visuales en el caso de la lectura), la primera 
tarea consiste en la identificación y activación de representaciones relativamente estables y 
discretas a partir de una señal acústica continua y extremadamente variable. Estas 
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Figura 1-2. Comprensión del lenguaje: esquema ge- 
neral del procesamiento. 
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representaciones estables que el sistema tiene ya previamente almacenadas corresponderían a 
los fonemas de la lengua particular que conoce el oyente. Se trata de una función bastante 
más compleja de lo que se pensó en un principio, dada la enorme variabilidad y versatilidad 
del estímulo. Por otra parte, para algunos autores no está claro que sea el fonema la unidad 
perceptiva básica con la que opera el sistema, cuestión que todavía se halla abierta. 

Otro paso necesario es la identificación de las palabras o lexemas contenidos en la señal a 
través de los procesos léxicos. Nos referimos a operaciones de acceso al «diccionario» o 
léxico mental, entendido como una hipotética estructura en la que se guarda de forma 
organizada la información asociada a las decenas de miles de palabras que conoce el oyente. 
Son necesariamente mecanismos muy rápidos y eficientes, porque identificamos una unidad 
léxica entre miles, a razón de dos o tres veces por segundo. ¿Se accede directamente a la 
unidad léxica en cuestión o se realiza algún tipo de búsqueda secuencial antes de dar con 
ella? Esta es una pregunta que aún no tiene una respuesta definitiva, y los investigadores se 
dividen entre los que defienden modelos de acceso directo y quienes creen en modelos de 
acceso secuencial, como veremos más adelante. ¿Es necesario identificar previamente los 
fonemas antes de identificar las palabras? Este es otro tema de discusión. Lo que parece claro 
es que algunas palabras de uso muy frecuente las identificamos probablemente como un todo 
sin analizarlas previamente en sus partes, y que para identificar una palabra no se necesita un 
análisis exhaustivo de todos sus componentes; no es necesario identificar todos y cada uno 
de sus fonemas (o letras, en el caso de la lectura). 

El siguiente paso es el del procesamiento sintáctico. Cuando comprendemos el lenguaje, no 
nos limitamos a extraer el significado de una lista de palabras aisladas, sino que manejamos 
palabras organizadas en oraciones. Como ya se ha señalado, la oración es la verdadera 
unidad de significado en el lenguaje, incluso por encima de la palabra, porque es en ella 
donde se realiza un acto predicativo, en el que se afirma algo sobre algo. Por ello, para 
comprender el lenguaje no es suficiente acceder al significado de las palabras, sino que el 
oyente o lector debe elaborar una representación del significado oracional combinando e 
integrando los significados individuales de las palabras sobre la base de una organización 
sintáctica y semántica. No hay que olvidar, además, que las palabras con mucha frecuencia 
son ambiguas y poseen más de un significado, a menudo muy distintos entre sí, y se debe 
escoger el adecuado según el sentido de la oración en que se integran. 

En consecuencia, durante la comprensión del lenguaje, llevamos a cabo un análisis sintáctico 
de la oración que nos permite extraer su estructura formal sintáctica y determinar qué 
unidades actúan de sujeto, cuáles de objeto directo, objeto indirecto, etc., y qué relaciones de 
dependencia se establecen entre ellas. Se trata de un proceso de segmentación. Esta clase de 
procesamiento, a juzgar por su Opacidad fenomenológica, se realiza comúnmente de modo 
automático e inconsciente, sin acceso desde el nivel de nuestra conciencia. Sólo salta a ésta 
cuando advertimos un error en el mensaje o una ambigiedad difícil de resolver que nos 
obliga a reparar conscientemente en la estructura sintáctica para optar por la mejor solución. 
Por otra parte, como vimos antes, desde el punto de vista lógico es un proceso de carácter 
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claramente formal, independiente del significado. En teoría podríamos construir un andamia- 
je sintáctico sin hacer uso de los significados, como lo demuestra el hecho de que podemos 
asignar una estructura sintáctica a la frase «los opilórios escrandaron fildamente». 

Además, el oyente debe realizar el procesamiento semántico del mensaje que está escu- 
chando (o leyendo), basándose en los significados léxicos y la asignación correcta de los 
papeles temáticos a las diferentes partes de la oración. Debe determinar qué entidad de la 
oración actúa como «agente» de la acción, quién o qué como «objeto», «lugar», «instru- 
mento» o «receptor de la acción», y construir una representación proposicional completa del 
significado que porta la frase. Es algo distinto de las funciones sintácticas meramente 
formales (sujeto, predicado). Hay que tener en cuenta que no existe una relación biunívoca 
entre los papeles semánticos y las funciones sintácticas; un mismo sujeto puede actuar como 
agente de la acción («Marta insultó a su hermana») o como receptor («Marta murió 
ahogada»), dependiendo del modelo real de la situación. Se trata, por consiguiente, de un 
procesamiento que no es meramente formal, sino que depende de los significados de las 
palabras y de sus propiedades semánticas. 

Uno de los problemas más importantes de la psicología del lenguaje es determinar qué tipo 
de relación o dependencia existe entre ambas clases de procesamiento, el sintáctico y el 
semántico. ¿Es el primero completamente autónomo e independiente del segundo, sin ser 
influido por él durante su ejecución? ¿Existe una interacción entre ambos desde el primer 
momento? Nos encontramos aquí con una manifestación del debate central sobre la 
modularidad de los componentes que participan en el procesamiento lingúístico, como vere- 
mos más adelante. Es decir, se discute acerca del grado de encapsulamiento que tienen los 
mecanismos responsables del parsing, o segmentación sintáctica, respecto de los que operan 
en el procesamiento semántico. 

Por otra parte, comprender el lenguaje es algo más que extraer el sentido de oraciones 
inconexas entre sí. La comprensión exige relacionar con coherencia las distintas partes del 
discurso (o texto), para construir una representación global y estructurada de su significado 
(Sandford y Garrod, 1994). La cuestión básica es: ¿existe un plano de representación propio 
que corresponda al discurso/texto por encima del plano oracional? Pocos autores cuestionan 
la existencia de este nivel de representación supraoracional, al que corresponderían 
operaciones propias de integración y de inferencia de información. 

La construcción de esa representación coherente se basaría en procesos pragmáticos que 
hacen uso de información que está más allá de la que estrictamente aparece en el estímulo y 
que debe ser inferida por el oyente. La generación de estas inferencias es posible gracias al 
conocimiento extralingúístico sobre el mundo en general. Se asume que la información 
correspondiente a este conocimiento general del mundo se halla almacenada en la memoria a 
largo plazo y está organizada de tal manera que podamos activarla inmediatamente siempre 
que sea necesario. Se trata del conocimiento que tenemos sobre el mundo que nos rodea y 
que no hemos estudiado en ningún sitio: los montes no vuelan ni comen, los patos vuelan, los 
perros tienen cuatro patas, las cosas caen hacia abajo, el fuego quema, el agua moja, un árbol 
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no se mueve, los seres vivos huyen del dolor, etcétera. Al mismo tiempo, es probable que el 
lenguaje contribuya a la formación de estas estructuras de información almacenada en 
memoria. Estos tipos de procesos que son más centrales y ocupan un lugar superior en la 
arquitectura cognitiva, son todavía poco conocidos a pesar de que el interés por ellos ha 
crecido en las últimas décadas. 

El esquema de la figura 1-2 marca también una división del trabajo entre los investigadores 
que se dedican a su estudio. Los grupos y laboratorios repartidos por el mundo que investi- 
gan, por ejemplo, en el campo de la percepción del habla son distintos de los que trabajan en 
el reconocimiento de las palabras, en procesamiento de oraciones o en inferencias en el dis- 
Curso. 

El diseño general presentado hasta aquí se refiere a la comprensión del lenguaje. En cierto 
modo podríamos pensar, grosso modo, en un esquema semejante, pero invertido y 
finalizando en la respuesta verbal para los procesos implicados en la producción del 
lenguaje. Esto se verá con más detalle al hablar de los modelos teóricos de la producción 
lingúística. 


CUESTIONES CENTRALES EN LA PSICOLOGÍA DEL LENGUAJE 

e Procesos abajo-arriba y arriba-abajo 
Al observar la figura 1-2 sobre el esquema general de procesamiento en la comprensión del 2 4. 
lenguaje, lo primero que viene a la cabeza es que la información del estímulo fluye desde 
abajo hacia arriba, desde los procesos perceptivos hasta los semánticos y pragmáticos, a 
través de las distintas etapas o niveles de trabajo. Este es el procesamiento abajo-arriba, 
conocido en la literatura internacional como procesamiento bottom-up, o también como 
guiado por los datos. Sin embargo, las cosas no son tan sencillas. Muchos autores consideran 
que, al mismo tiempo, se produce un procesamiento en sentido inverso, de arriba-abajo, o 
top-down. En virtud de este procesamiento, también conocido como guiado 
conceptualmente, los procesos superiores influyen sobre los inferiores facilitándoles la tarea. 
Así, por ejemplo, los procesos perceptivos se beneficiarían de información descendente 
desde los niveles léxicos y oracionales, haciendo que su trabajo sea más rápido y requiera 
menos información del estímulo. Una manifestación de este hecho es el denominado efecto 
del contexto, que se trata en el capítulo 5, y del que anticiparemos ahora algunos ejemplos. 
Recientemente han circulado por internet mensajes similares al del recuadro 1-3. 


Recuadro 1-3. TEXTO CON LAS LETRAS DESORDENADAS 

Sgeun un etsduio de una uivenrsdiad ignlsea, no ¡pmotra el odren en el que las Itears etsan 
ersciats, la uicna csoa ipormtnate es que la pmrirea y la utlima Itera estén ecsritas en la 
psiocion cocrrtea. El rsteo peuden estar ttaolmntee mal y aun pordas lerelo sin pobrleams. 
Etso es pquore no lemeos cada Itera por sí msima praa pericbir las palarbas. 


Como comprobará el lector, a pesar de que las palabras tienen las letras desordenadas, es 
posible leerlo sin gran dificultad al beneficiarnos del contexto oracional. Gracias a los 
procesos superiores (sintáctico/semánticos y pragmáticos), mientras leemos el texto 
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construimos una representación global de su significado que nos permite anticipar en gran 
medida las palabras que nos vamos encontrando y reconocerlas con poca información 
estimular (letras desordenadas). Algunas versiones de este mensaje aluden a un hipotético 
estudio al respecto realizado en la Universidad de Cambridge. Matt Davis, de dicha 
universidad, después de consultar con diversos colegas, no pudo precisar si tal trabajo se 
había llevado a efecto, pero le encantó el ejemplo y se tomó la molestia de reunir muestras 
similares procedentes de varios idiomas, en la página web http://vvww.mrc-cbu.cam.ac.uk/- 
mattd/Cmabrigde/index.html. 

A título de anécdota curiosa, parece que la demostración original de las letras desordenadas 
se debe a Graham Rawlison en una carta publicada en New Scientist (Rawlison, 1999), en 
respuesta a un artículo de Nature sobre un efecto semejante en el lenguaje hablado (Saben y 
Perrot, 1999). 

En la figura 1-3 se presentan otras muestras del efecto del contexto sobre los procesos 
perceptivos. 


Están inspirados en ejemplos del libro de Rumelhart y 


€ A : N A McClelland (1986) con palabras inglesas. En la primera 


línea, un mismo patrón gráfico se interpreta como H en 
una ocasión y como A en otra, dependiendo de su 


C A E E posición en la palabra china. En los siguientes casos, 
| patrones ambiguos se interpretan como letras distintas 
(F frente a E; P frente a B) a consecuencia del contexto 


- F N A léxico. Todos son ejemplos de procesamiento arriba- 


abajo, en los que la información que proviene de los 


P | Q 0) procesos léxicos que permiten identificar la palabra, 
Dos influye en los procesos inferiores de identificación de 
letras. Se trata de un camino dinámico de ida y vuelta, 

] U P O probablemente simultáneo: las palabras se identifican 


gracias a sus letras, pero las letras se identifican gracias 


Figura 1-3. Efecto del contexto léxico sobre la per- d la palabra. 
pcs tumeterY Hay que concebir, por lo tanto, toda la arquitectura 
cognitiva como un sistema dinámico que interactúa 
continuamente en ambos sentidos, y esta es una de las principales dificultades para su 
replicación artificial a través de las máquinas. Como propiedad general del sistema se debe 
pensar que cuanta más información fluye de arriba-abajo, menos se necesita de abajo-arriba. 
Cuanto más poderoso sea el efecto del contexto, menos información se requerirá desde el 
estímulo. En el contexto de una frase en letra manuscrita, un simple garabato puede bastar 
para identificar una palabra, mientras que ese garabato escrito de modo aislado sería insufi- 
ciente para ello. Un sonido que escuchado de forma aislada sería casi inaudible, en el marco 


de un mensaje coherente sirve para identificar un fonema o una palabra. 
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e Modularidad 
La mente no es un todo uniforme e indiferenciado. Al igual que el cuerpo está compuesto por 
órganos distintos que desempeñan funciones específicas, la mente podría tener componentes 
diferenciados que llevaran a cabo subprocesos o tareas especializadas dentro del conjunto 
general. Sobre ello hay un planteamiento más radical: ¿alguno de estos componentes sería un 
módulo, o constituiría un proceso modular? El gran teórico de la modularidad ha sido Jerry 
Fodor y la obra de referencia es su libro de 1983 The modularity of Mind, publicado en 
castellano 2 años después (Fodor, 1985). Para Fodor, un módulo es un tipo de proceso con 
unas características particulares (Fig. 1-4): 
* Los módulos son específicos de dominio, es decir, 
| | | | | están especializados en un tipo particular de estímulos 

Encapsulado: impermeable a otros procesos y sólo trabajarían ante una clase específica de 
información. Por ejemplo, un módulo especializado 
en un determinado subproceso perceptivo visual sólo 
actuaría ante estímulos visuales de ciertas 

a Escuadra de Un Bana pre características, permaneciendo impasible ante otras 

ceso modular, y sus características. clases de estimulación. Si el mecanismo lingúístico es 
un módulo, como defienden algunos autores, éste sólo actuaría ante estímulos de lenguaje. 
« Los módulos funcionan de modo obligatorio ante la presencia del estímulo apropiado. Es 2 6 
decir, en el momento en que está presente la información específica sobre la que el módulo 
está especializado, éste se activa inevitablemente. En términos coloquiales, en cuanto «está a 
tiro» la información específica de dominio, el módulo se dispara sin remedio. Por ejemplo, 
no podemos mirar una palabra sin leerla; ante «mano» es imposible verla simplemente como 
un conjunto de trazos sin acceder a su significado. Precisamente, el fenómeno Stroop es un 
efecto muy poderoso imposible de evitar incluso tras meses de práctica (en su formulación 
clásica, consiste en la dificultad de nombrar el color físico de palabras escritas en colores, 
cuando éstas son nombres de colores que no coinciden con su color físico, p. ej., ante la 
palabra «rojo» escrita con tinta azul, el sujeto debe decir «azul» rápidamente; los tiempos de 
reacción son mucho más lentos que ante conjuntos de letras sin sentido, xyzxn, porque no 
podemos ignorar el significado, que compite con el color físico). Tampoco podemos 
escuchar una palabra como si fuera un sonido ininteligible. Si esta palabra es un insulto, o 
cualquier otro vocablo, su significado se activará en nuestra mente aunque nos obstinemos en 
impedirlo. 
* Los módulos están encapsulados, blindados ante cualquier otro proceso. Cuando un módulo 
se activa, su tarea no se ve afectada por la acción de cualquier otro proceso, su actividad es 
impermeable a cualquier influencia exterior. Según Fodor, ésta es una de las características 
más relevantes en su concepción modular. 
* Los módulos son rápidos; realizan su actividad en un plazo de milisegundos. Por ejemplo, 
acceder al significado de una palabra lleva menos de 200 milisegundos. 


Información 
específica 
de dominio 
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* Los módulos son automáticos y su actividad es poco accesible a la conciencia. Su tarea es 
automática y autónoma, no podemos intervenir en ella de forma controlada y el propio 
proceso es opaco a nuestra conciencia. Sólo somos conscientes de los productos finales, no 
de las representaciones intermedias que se generan dentro del módulo. Por ejemplo, no 
somos conscientes de cómo llegamos al significado de las palabras, del mecanismo en sí; 
sólo lo somos del producto final, cuando ya hemos accedido al significado. Para entender las 
oraciones tenemos necesariamente que reconstruir su estructura sintáctica, pero no somos 
conscientes de cómo lo hacemos; sólo reparamos en ello cuando algo va mal y alguna parte 
no encaja en la estructura. 

Fodor planteó también otras características, como el hecho de que el desarrollo ontogenético 
de los módulos seguiría una secuencia madurativa fija, de unos individuos a otros, durante 
las fases tempranas de la evolución infantil. Para Fodor, los módulos también deben ser 
compactos y estar localizados en estructuras neuronales fijas. En nuestros días no se hace 
tanto hincapié en esta cuestión porque hay evidencia de que procesos automáticos y dotados 
de las características mencionadas podrían depender de sistemas neurales distribuidos. 
Originalmente, el planteamiento modular de Fodor se dirigía hacia los denominados sistemas 
de entrada, O procesos perceptivos, y sobre algunos procesos de salida. Un caso típico de 
módulo sería la visión estereoscópica, o visión en profundidad a partir del par de imágenes 
generadas por los ojos. Este mecanismo automático y encapsulado se pondría en marcha 
inevitablemente cada vez que le llegara el estímulo apropiado: la información visual 
procedente de las dos retinas dirigidas al mismo campo visual con una diferencia angular de 
equis grados. Otros módulos se encargarían de subprocesos específicos relacionados con la 
percepción de formas, el espacio, etcétera. 

Más allá de los sistemas perceptivos, muchos autores se han preguntado si la función del 
lenguaje en su conjunto tiene propiedades modulares. Chomsky (1980) y algunos de sus 
seguidores entienden que nuestra especie posee un «órgano del lenguaje» innato, generado a 
lo largo de la evolución humana, que funcionaría como un módulo separado del resto del 
sistema cognitivo. Este órgano del lenguaje, en analogía a otros órganos del cuerpo, como el 
sistema digestivo, sería un órgano autónomo que seguiría un curso de desarrollo 
ontogenético independiente del desarrollo cognitivo general. Otros autores, por el contrario, 
en una tradición teórica que arranca desde Piaget (1923), conciben el lenguaje como un 
proceso cognitivo más entre otros y cuyo desarrollo dependería directamente del desarrollo 
cognitivo global. 

En cierto modo, una concepción modular del lenguaje tendría sus ventajas, porque permitiría 
que los investigadores fueran también «modulares» en su trabajo y se centraran en procesos 
separados e independientes (García Albea, 1991). Pero, como se plantean de Vega y Cuetos 
(1999), ¿la modularidad es una propiedad real o sólo una propiedad conveniente del 
lenguaje? Parece que la evidencia empírica se decanta sobre todo hacia los niveles de 
procesamiento inferiores, o más periféricos, mientras que en los procesos superiores, o más 
centrales (semánticos y pragmáticos), el concepto de modularidad queda difuminado. Es 
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decir, muchos teóricos no conciben el lenguaje como un módulo en su totalidad, pero sí 
reconocen propiedades modulares en algunos de sus componentes. 
Tradicionalmente se ha aducido como prueba a favor de los procesos modulares la existencia 
de disociaciones dobles en pacientes con lesiones cerebrales. Como veremos más adelante, 
estas disociaciones se dan cuando dos personas con lesiones distintas presentan 
características opuestas: un paciente tiene preservada la función A y afectada la B, mientras 
que el otro tiene preservada la B y afectada la A. 
En todo caso, la modularidad es una cuestión que divide a los grupos de investigación 
focalizados en las distintas etapas de procesamiento. Como muestra, en el campo de la 
percepción del habla, el eje de discusión teórica ha discurrido a lo largo de 50 años entre dos 
concepciones de base divergentes: por una parte, una tradición que nace en los laboratorios 
Haskins y que defiende la existencia de un mecanismo específico para percibir el lenguaje, 
separado de la percepción auditiva general (Liberman, 1996) y, por otra, los que entienden 
que el lenguaje es percibido gracias a los mismos mecanismos generales que intervienen en 
la percepción de cualquier sonido (p. ej., Kiefte yKluender, 2005). 

e Autonomía o interacción en los procesos 
Esta cuestión está estrechamente relacionada con la anterior sobre la modularidad (Bowers y 
Davis, 2004). A la vista del esquema general de la arquitectura cognitiva (Fig. 1-2), nadie 
duda de que los distintos componentes dependen y están relacionados entre sí. La pregunta 
se plantea con respecto al grado de autonomía que cada subproceso tiene mientras ejecuta su 
operación. En este punto dos modelos o visiones se contraponen. El modelo autónomo no 
niega la interdependencia de los componentes en cuanto a sus productos finales, pero consi- 
dera que son autónomos durante la ejecución interna de su tarea y que ésta no se ve alterada 
por influencias exteriores. El modelo interactivo, por el contrario, considera que la 
interactividad alcanza al funcionamiento interno de los componentes cognitivos. 
Refiriéndose a realidades más concretas, hoy no se cuestiona, por ejemplo, el efecto del 
contexto, pero sí su verdadera interpretación, el locus de su acción en el procesamiento 
lingúístico: ¿afecta el contexto realmente a los procesos perceptivos per se o simplemente 
restringe las opciones posibles, permitiendo conjeturas por parte del sujeto, es decir, la 
adivinación (no percepción) del estímulo? En el experimento clásico de Tulving y Gold 
(1963), un contexto oracional apropiado permite identificar una palabra escrita con bastantes 
menos milisegundos de exposición que si ésta se presenta de forma aislada o en un contexto 
inapropiado. ¿Se trata realmente de un proceso perceptivo? ¿Esa palabra se percibe de 
verdad más rápido y mejor? ¿O es el resultado de que las posibilidades se reducen y hay más 
oportunidad para un proceso de adivinación? En el extremo, un contexto que sólo permitiera 
una opción («dos y dos son...») no necesitaría ni siquiera el estímulo; en este caso no habría 
nada que percibir. 
Otro ejemplo citado anteriormente se relaciona con el procesamiento sintáctico de una 
oración. Sabemos que guarda relación en última instancia con el procesamiento semántico, 
en el que intervienen los significados léxicos, pero tiene cierta autonomía funcional y puede 
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ocurrir sin información semántica. Recordemos la frase «los opilorios escrandaron 
fildamente a los plandiscos avistosos» (Belinchón et al., 1992), que ilustra cómo el lenguaje 
suministra suficientes pistas morfosintácticas para construir el andamiaje formal sin usar 
significados. Aquí, ambos modelos, autónomo e interactivo, tienen visiones divergentes. El 
primero considera que existe un analizador autónomo que se pone en marcha de forma 
automática e independiente y cuyo funcionamiento no se ve influido por otra información 
externa; después, su producto (una estructura sintáctica) es revisado por los procesos 
semánticos y pragmáticos y, si existe incongruencia o hay que resolver ambigiúedades, el 
analizador puede retomar su trabajo y volver a generar otra estructura congruente con el resto 
de la información, pero su cometido es completamente autónomo o modular. El modelo 
interactivo, por el contrario, entiende que el procesamiento sintáctico está íntimamente unido 
al semántico y ya desde el principio intervienen ambos tipos de información en la 
construcción de la estructura sintáctica. “Todas estas cuestiones se verán en detalle más 
adelante. 


MÉTODOS DE INVESTIGACIÓN EN PSICOLOGÍA DEL LENGUAJE 

La gran variedad de teorías y modelos que existen dentro de la psicología del lenguaje, así 
como el elevado número de procesos cognitivos que intervienen en el procesamiento 
lingúístico, implican la existencia de un amplio abanico de estrategias metodológicas, que se 
abordarán con detalle en los sucesivos capítulos a medida que estudiemos los procesos 
concretos. Todas estas estrategias tienen en común el hecho de contrastar las hipótesis con la 
realidad a través del método científico, es decir, son formas diferentes de aplicar el método 
científico a través de la observación y la experimentación. Pero hay muchas formas de 
observar y muchas más de experimentar, y la elección de una técnica concreta depende del 
proceso que se quiera estudiar, de los planteamientos teóricos de los que se parta y de las 
tecnologías de las que se disponga. 

Así, tradicionalmente —aunque las cosas están cambiando-, para el estudio de la 
comprensión se ha utilizado más la experimentación, y para la producción, la observación. 
Eso se debe a que es relativamente fácil manipular las variables de los estímulos que los 
sujetos van a comprender, pero es realmente difícil manipular los estímulos que van a 
producir, ya que la producción se origina a partir de las ideas y los conocimientos del propio 
hablante. Por ello, los investigadores han tenido que recurrir a los métodos observacionales 
para estudiar la producción. La observación de las pausas del habla, de las vacilaciones o de 
los errores que las personas cometen al hablar permite hacer inferencias sobre el 
funcionamiento del sistema de producción. Pero aun aportando valiosos datos, la 
observación no tiene la fortaleza de la experimentación, principalmente porque no es posible 
producir el fenómeno que se quiere estudiar; hay que esperar a que ocurra espontáneamente 
y eso a veces tarda en suceder. En cambio, con la experimentación se puede producir el 
fenómeno tantas veces como se quiera. De ahí que se estén utilizando cada vez más las 
metodologías experimentales en producción, como se verá más adelante. 
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En función del índice de respuesta que se considere hay dos tipos fundamentales de técnicas 
experimentales en la psicología del lenguaje: conductuales y fisiológicas. Dentro de las 
conductuales están las basadas en el recuerdo y las basadas en los tiempos de reacción. 

El recuerdo ha sido una variable muy utilizada en psicología del lenguaje, especialmente 
para el estudio de unidades complejas como la oración o el texto. Este índice se basa en el 
supuesto de que los procesos de comprensión y memoria están íntimamente relacionados, de 
manera que los resultados en las pruebas de memoria reflejan el nivel de comprensión. Pero 
este supuesto tiene algunos problemas importantes y el principal es que no hay una relación 
tan directa entre lo que se comprende y lo que se recuerda. Es evidente, y lo saben bien los 
estudiantes, que es posible memorizar textos que no se han comprendido, y viceversa, se 
pueden comprender textos que luego no se recuerdan. Por otra parte, los numerosos estudios 
realizados sobre la comprensión de textos han mostrado que, junto a la información 
proporcionada por el texto, se guarda información inferida por el lector a partir de sus 
propios conocimientos. Además, si se produce un intervalo grande entre el momento en que 
se realiza la comprensión y el momento en que se aplica la prueba de recuerdo, puede ocurrir 
un gran número de operaciones mentales que se escapan al control del investigador. Cuando 
los sujetos no recuerdan una información, rellenan las lagunas con sus propios 
conocimientos. 

Las metodologías sin duda más utilizadas para el estudio del procesamiento lingúístico son 
las basadas en los tiempos de reacción, esto es, el tiempo que transcurre (generalmente me- 
dido en milisegundos) desde que se presenta un estímulo hasta que el individuo emite una 
respuesta. El estímulo puede ser un fonema, una palabra, una frase o un estímulo no lin- 
gúístico, como, por ejemplo, un dibujo. El experimentador puede manipular esos estímulos 
en función de la cuestión que esté estudiando; así, puede utilizar palabras de frecuencia alta o 
baja, concretas o abstractas, nombres o verbos, etc., frases sintácticamente complejas o 
simples, cortas o largas, etc. Y la respuesta puede consistir en pulsar un botón, nombrar la 
palabra o cualquier otra respuesta conductual. Esto hace que existan numerosas metodologías 
basadas en los tiempos de reacción: identificación de fonemas, decisión léxica, 
categorización semántica, verificación de frases, denominación de dibujos, etc. A pesar de 
que el tiempo de reacción es una medida muy simple y sujeta a muchas variaciones (es 
inestable, sensible al tipo de receptor, sensible a la práctica, varía enormemente de unas 
personas a otras, etc.), es el índice más objetivo de que dispone el psicólogo experimental, ya 
que mantiene una estrecha relación con la complejidad del proceso mental requerido para 
ejecutar la respuesta: cuanto más tiempo exige la ejecución de una tarea, mayor es el número 
de operaciones mentales que requiere. 

Entre las metodologías de tiempos de reacción hay dos grupos distintos de técnicas: las que 
informan sobre el tiempo total que requiere la realización de determinado proceso y las que 
informan sobre el curso temporal del proceso (técnicas en curso). En ambos casos los 
tiempos son muy breves (por lo general se miden en milisegundos), y la medición se realiza 
inmediatamente después de que se produce el proceso (en el primer caso) o durante éste. 


booksmedicos.org 


30 


Psicología del Lenguaje — TEMA 1 


Entre las que miden el tiempo total del proceso, una de las más conocidas para estudiar el 
procesamiento de palabras es la de decisión léxica. En la modalidad visual se presentan 
series de letras ortográficamente legales sobre la pantalla del ordenador, y los participantes 
tienen que responder, pulsando uno de dos botones, dependiendo de si se trata de una palabra 
real (p. ej., plato) o no (p. ej., plota). En la modalidad auditiva, el participante escucha series 
de fonemas y, también a mediante dos botones, tiene que responder si corresponden a una 
palabra de su idioma. El cronómetro se pone en marcha en el momento en que se presenta la 
palabra y se detiene en el momento en que el participante pulsa el botón. El intervalo entre 
esos dos momentos es el tiempo que corresponde a cada palabra. La lógica de esta técnica es 
que para poder responder si una serie de letras o fonemas corresponden a una palabra, el 
participante tiene que acceder a su léxico interno para comprobar si existe o no esa palabra. 
La rapidez con la que responde ante cada palabra indica la accesibilidad de esa palabra. 

Entre las técnicas en curso la más conocida es la de seguimiento de los movimientos 
oculares. Esta técnica registra los movimientos de los ojos de los lectores mientras leen las 
sucesivas oraciones de un texto. Entre los varios procedimientos disponibles para realizar 
este seguimiento, uno de los más simples consiste en emitir un rayo de luz infrarroja sobre la 
córnea del lector. El ángulo de reflexión del rayo a medida que el ojo cambia de dirección 
permite saber qué parte del texto está mirando el lector en cada momento, cuánto tiempo está 
detenido en cada posición y adonde dirige el siguiente movimiento. En función de la 
dificultad de las oraciones y/o palabras se comprueba que los lectores se detienen más 
tiempo en ciertas partes del texto o que hacen mayor número de regresiones hacia atrás, a 
partes del texto que ya habían leído. 

En cuanto a las técnicas fisiológicas también hay dos tipos: las que recogen los cambios en la 
actividad electrofisiológica generada por el cerebro (potenciales evocados) y las que recogen 
los cambios de activación cerebral (técnicas de neuroimagen: resonancia magnética 
funcional, magnetoencefalografía, etc.). Las técnicas fisiológicas se describirán con detalle 
en el capítulo 3. 


RESUMEN: 

e Lapsicología del lenguaje, también denominada psicolingúística, es la disciplina que 
estudia los mecanismos cognitivos y fisiológicos responsables de la comprensión y la 
producción del lenguaje. Su historia comienza con los primeros estudios iniciados en 
el mismo momento que surgió la psicología científica, a finales del siglo XIX en 
Alemania. Su aparición oficial como disciplina data de los años cincuenta del siglo 
XX, como consecuencia de las reuniones de un grupo de psicólogos y lingiiistas en 
una universidad norteamericana. El famoso debate Chomsky-Skinner constituyó un 
hito que marcó el camino de la nueva psicolingúística. 

e En el sistema de procesamiento lingiístico intervienen distintos componentes: 
fonológico, léxico, sintáctico, semántico, etc., y existen diferentes teorías sobre su 
funcionamiento. Algunas de las cuestiones centrales de la psicología del lenguaje son 
el procesamiento de arriba-abajo y de abajo-arriba, la modularidad y la interactividad. 
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e Las principales metodologías utilizadas en la recogida de datos empíricos son las 
conductuales y las fisiológicas. Dentro de las primeras están las basadas en el 
recuerdo y las basadas en los tiempos de reacción, los cuales guardan una relación 
directa con la complejidad de los procesos mentales. 


Preguntas de reflexión: 
e ¿Cuál es el objeto de estudio de la psicología del lenguaje? 
e ¿Cuándo y dónde surgió la psicología del lenguaje y por qué? 
e ¿Por qué la explicación que proporciona Skinner del lenguaje es insuficiente? 
e ¿Crees que el lenguaje es modular? Razona tu respuesta. 


e ¿Por qué se emplean tanto las metodologías basadas en los tiempos de reacción? 


BIBLIOGRAFÍA BÁSICA 
Bayés, R. (1977). ¿Chomsky o Skinner? La génesis del lenguaje. Barcelona: Fontanella, de 
Vega y Cuetos, F. (1999). Psicolingiiística del español. Madrid: Trotta. 
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Objetivos de aprendizaje 
Al finalizar el capítulo el alumno será capaz de: 
e Entender por qué el lenguaje humano difiere de los restantes lenguajes animales. 
e Conocer los rasgos distintivos del lenguaje humano. 
e Comprender las limitaciones de los animales para utilizar el lenguaje humano. 
e Conocer las diferentes familias de lenguas que existen en el mundo y sus peculiaridades. 


INTRODUCCIÓN 
Nuestro planeta ha generado unos objetos curiosísimos, inéditos en cualquier otra parte 
conocida. Esas cosas extravagantes que se auto-mueven, duplican e intercambian materia con 
el entorno están dotadas de una propiedad especial que denominamos comportamiento. Por si 
esta peculiaridad fuera pequeña, una criatura llama la atención sobre las demás. El Homo 
sapiens posee algo que no tiene parangón en los demás organismos: su lenguaje. La mayoría 
de las capacidades conductuales y cognitivas humanas, incluidas la categorización o el manejo 
de herramientas, se pueden observar, al menos de modo rudimentario, en otras especies 
animales. Pero esto no ocurre con el lenguaje; de ser así, nuestros primos hermanos, los 
chimpancés, dispondrían de gramáticas rudimentarias y de vocabularios de varios centenares 
de palabras, o elementos equivalentes. Existe el lenguaje humano y punto; luego hay otros 
lenguajes y sistemas de comunicación que nada tienen que ver con el nuestro. No se trata de un 
falso chovinismo de especie o de una visión antropocéntrica de la naturaleza; simplemente es 
la constatación de una realidad. Esta singularidad del lenguaje humano dentro del reino animal 
(y el universo conocido) complica la vida a quienes pretenden estudiarlo, porque los priva de 
cualquier otro referente comparativo. 
Los chimpancés salvajes emplean unas pocas docenas de sonidos para comunicar unas pocas 
docenas de significados. Los seres humanos también emplean unas pocas docenas de sonidos, 
pero con sus combinaciones transmiten millones de significados distintos. Nadie ha sido capaz 
aún de dar una explicación satisfactoria de cómo y qué tipo de presión evolutiva hizo pasar de 
un sistema al otro (Fig. 2-1). 
fo | Los chimpancés pueden repetir un sonido con el fin de dar mayor 
aceras) 2 ques, 4 | intensidad al significado, pero nunca juntarán tres de ellos para 
ES añadir a su vocabulario una voz nueva (Calvin, 1999). Con toda 
A seguridad, el lenguaje humano es el mayor logro evolutivo 
a alcanzado por una criatura zoológica, en lo que se refiere a 
- Al complejidad neural. Pertenecemos a una especie que, en palabras de 
Á EY Steven Pinker, «con sólo hacer unos ruiditos con la boca, 
“4 | conseguimos que en la mente de otra persona surjan nuevas 
ls crimpances y en losueres humanos Combinaciones de ideas» (Pinker, 1995, p. 15). Sería imposible 
imaginar un sistema de civilización -tal como la entendemos- sin la existencia del lenguaje. Se 
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trata de una de las funciones psicológicas cuya realidad nos resulta más cercana. Aparece hacia 
el primer año y nos acompaña durante toda la vida, interviniendo en la mayor parte de nuestras 
actividades diarias. A pesar de que, probablemente, es la función cognitiva más complicada 
del repertorio humano, adquirimos el lenguaje de modo natural y sin apenas esfuerzo aparente. 
La complejidad del lenguaje se pone de manifiesto en la enorme dificultad que encierra su 
replicación artificial mediante máquinas. Hace unas décadas, cuando surgieron las 
computadoras y se empezaron a dar los primeros pasos en la inteligencia artificial, se vaticinó 
que en el año 2000 sería habitual hablar con robots que entenderían y usarían nuestro lenguaje 
con desenvoltura. Es probable que ese momento llegue, pero no será mañana, ni pasado 
mañana. Si un ordenador es capaz de encontrar nuevas soluciones a teoremas matemáticos, 
resolver sistemas de ecuaciones de un millar de incógnitas o hacer tablas con el campeón 
mundial de ajedrez, ¿por qué no habría de simular razonablemente bien la función lingúística? 
Cuando los ingenieros programadores, junto con psicolingúistas, se pusieron manos a la obra, 
les embargó la sensación de enfrentarse al ancho mar. Desde entonces ha continuado sin pausa 
el progreso, pero hoy sabemos que ese objetivo está aún relativamente lejano. No nos 
referimos a la mera percepción del habla, es decir, la identificación ciega de fonemas y 
palabras al dictado; esto ya se hace, aunque con importantes limitaciones. Hablamos sobre el 
hecho de que una máquina pueda «comprender» razonablemente bien cualquier oración del 
lenguaje natural, aunque se le proporcione de forma escrita a través de un teclado. Introducir, 
por ejemplo, un texto en un ordenador y que éste devuelva un resumen de él, o subraye las 
ideas principales, o mantenga una conversación razonable sobre los acontecimientos del día. 
Hoy el ordenador más potente del mundo, capaz de ejecutar billones de operaciones por 
segundo, no alcanza a rozar la neurocomputación -paralela- que lleva a cabo el cerebro de un 
niño de 4-5 años de edad cuando usa el lenguaje. Las posibilidades lingiiísticas de la 
supercomputadora están muy por debajo de las humanas, porque entender y producir lenguaje 
implica, además de una gramática compleja, disponer de un modelo organizado del mundo 
sobre el que se quiere hablar. 
¿Qué es el lenguaje? Existen decenas de definiciones, pero ninguna llega a ser plenamente 
satisfactoria. La más simple sería «un sistema de símbolos y reglas que permiten 
comunicarnos». Símbolos son elementos que representan a cosas con las que no guardan 
relación de semejanza física; por ejemplo: una bandera y la nación representada; las palabras y 
los objetos o acciones a las que se refieren. Las reglas determinan el modo en que se pueden 
combinar las palabras para formar oraciones. 
Por otra parte, las definiciones sobre el lenguaje también dependen del posicionamiento 
teórico de cada uno. Como muestra, comparemos las dos definiciones siguientes, tan dispares 
entre sí. La primera es de Alexander R. Luria, el gran neuropsicólogo ruso. La segunda 
pertenece a John B. Watson, máximo representante del conductismo, corriente imperante en la 
psicología durante la primera mitad del siglo xx. 

* «El lenguaje es un sistema de códigos con la ayuda de los cuales se designan los objetos 

del mundo exterior, sus acciones, cualidades y relaciones entre ellos» (Luria, 1977). 
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+ «El lenguaje es un hábito manipulatorio» (Watson, 1924). 


CARACTERÍSTICAS DEL LENGUAJE HUMANO 

Sabemos que muchos animales también tienen alguna forma de lenguaje o comunicación. 
Ciertas especies consiguen, incluso, una gran eficacia comunicativa; es el caso de insectos 
como las abejas. El premio Nobel alemán Karl von Frisch empleó 30 años de su vida en 
estudiar el comportamiento de las abejas y sus formas de comunicación. Sus observaciones 
demostraron que cuando una abeja volvía de una zona lejana, abundante en flores con néctar, 
podía transmitir su posición al resto de la colmena a través de una «danza» o un patrón 
complejo de movimientos corporales. Con su baile, la abeja proporciona tres clases de 
información: la dirección de las flores desde la colmena en relación con la posición del sol; la 
cantidad de flores existentes y, finalmente, la distancia a ellas. Sus compañeras, después de 
observar la danza, son capaces de volar directamente y localizar la zona indicada. Aquí 
tenemos un ejemplo de un sistema de comunicación animal altamente eficiente, aunque dentro 
de un dominio muy restringido de información: localización de una fuente de recursos. 

El lingúista estadounidense Charles Francis Hockett, a través de diversos trabajos, propuso 
una lista de 16 propiedades o rasgos característicos del lenguaje verbal humano (Hockett, 
1960): 

1. Canal vocal-auditivo: el emisor emplea un conducto vocal y el receptor un mecanismo 
auditivo. 

2. Transmisión generalizada y recepción direccional: debido a las propiedades físicas del 
medio, una señal circula en todas las direcciones desde el hablante, mientras que el 
receptor puede localizar la dirección de procedencia. 

3. Desvanecimiento rápido: la señal se desvanece rápidamente en el tiempo. 

4. Intercambiabilidad: los individuos pueden intercambiar sus papeles de emisores y 
receptores del lenguaje. 

5. Retroalimentación completa: los emisores pueden recibir información de sus propias 
señales y así controlar su producción. El emisor de una señal lingúística es al mismo 
tiempo receptor de ella. 

6. Especialización: el sistema está especializado para el fin lingiístico. No sirve para algo 
distinto de su propio uso. 

7. Semanticidad: las expresiones tienen significado, se refieren a cosas o propiedades del 
mundo. 

8. Arbitrariedad: se da una relación arbitraria entre significante y significado. Los 
símbolos son abstractos. 

9. Carácter discreto: el sistema de señales puede subdividirse en unidades discretas y 
repetibles. 

10.Desplazamiento: puede referirse a cosas no presentes en el espacio y el tiempo. 

11.Productividad: posibilidad de elaborar e inventar nuevos mensajes, sin límite. 
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12. Transmisión tradicional: el sistema se aprende de quienes lo usan. El lenguaje pasa de 
una generación a otra. 
13.Dualidad de patrones: el sistema consta de un conjunto de unidades sin significado 
(sonidos) combinadas en otras unidades con significado (palabras y oraciones). 

14.Prevaricación: el lenguaje nos proporciona la capacidad de mentir y engañar. 

15.Reflexividad: el sistema lingúístico puede comunicar sobre el propio sistema. 

16. Aprendible: el hablante de un lenguaje puede aprender otro. 
No quiere decir que todas estas propiedades sean exclusivas del lenguaje humano. Por 
ejemplo, el canal vocal-auditivo lo comparten muchas especies animales, como la mayor parte 
de los mamíferos y aves. Pero ningún sistema de comunicación animal reúne juntas las 16 
propiedades. 
Si, de todas las características señaladas, hubiera que elegir las más importantes y distintivas 
del lenguaje humano, sin duda serían las tres siguientes (Glucksberg y Danks, 1975): 

+ Doble articulación (dualidad de estructura). 

+ Referencia simbólica arbitraria. 

+ Productividad o creatividad. 
Doble articulación (dualidad de estructura). En el mundo existen unas 5.000 ó 6.000 
lenguas, y todas ellas, sin excepción, se organizan sobre la base de dos niveles de articulación 
(Fig. 2-2 A). Se parte de un conjunto reducido de sonidos desprovistos de significados 
(fonemas) y, por combinación de éstos, se obtienen decenas de miles de elementos dotados de 
significado (palabras). Esta sería la primera articulación. Muy pocas lenguas sobrepasan el 
centenar de fonemas; la mayoría tiene dos o tres decenas, pero, a través de este mecanismo, 
dan lugar a vocabularios formados por miles de palabras. Hay que pensar que si cada sonido 
tuviera que estar dotado de un significado, el número de significados posibles sería muy 
reducido, ya que las capacidades sonoras de nuestro aparato vocal son limitadas. 
Sin embargo, la verdadera unidad de significado es la oración. Nadie dice simplemente 
«ventana»; la esencia del lenguaje consiste en un acto predicativo, o sea, decir algo sobre algo: 
«la ventana está sucia», «acaban de pintar esta ventana», etc. En este sentido, es la oración la 
verdadera unidad de significado del lenguaje. Llegamos así a la segunda articulación: la 
combinación de palabras da lugar a un número 


hi eb prácticamente ilimitado de oraciones. 
O | Referencia simbólica arbitraria. ¿En qué se parece un 
] | Caballo a la palabra «caballo»? ¿o a la palabra cheval, en 
leucenas de ile] | francés, o 'horse', en inglés? Realmente en nada. La relación 
Rf sidad entre las palabras y las cosas representadas es arbitraria, no 
1? articulación del lenguaje añedad del fanal ] . N E y" 
[ES anterees 90 neo | existe ninguna semejanza física entre ambas (Fig. 2-2 B). 
¿En qué se parecen estas | Ñ > R Ñ e . 
Sonidos (decenas) doscoss? | El lenguaje está constituido por símbolos y, precisamente, 
A B | ”,. , , 
: una de las características de los símbolos es su carácter 
Figura 2-2. Doble articulación (A) y arbitrariedad del A A ro. 
enguaje humano (B). Todas las lenguas del mundo abstracto, su ausencia de parecido físico con lo 


responden a este diseño general. 


representado. Esta propiedad del lenguaje humano ya fue 


booksmedicos.org 


Psicología del Lenguaje — TEMA 2 


puesta de manifiesto por el lingilista suizo Ferdinand de Saussure, cuyas lecturas fueron 
publicadas postumamente por sus alumnos en 1916. Se trata de la arbitrariedad del signo, o la 
relación arbitraria entre significante (palabra) y significado (objeto o acción). 

Este rasgo, junto con la dualidad de estructura, contribuye a la enorme productividad del 
lenguaje humano. Por ejemplo, si la semejanza física con lo representado fuera obligatoria, ¿a 
qué deberían parecerse palabras como «desde» o «posible»? 

Una excepción a esta regla lo constituyen un grupo reducido de palabras, las onomatopeyas, 
cuyo sonido guarda semejanza física con el sonido de lo representado (generalmente sonidos 
de animales, golpes, etc.). De hecho, existen similitudes a través de los idiomas. Por ejemplo, 
el sonido vocal del pato se representa siempre con una consonante sorda velar (/k/); castellano: 
cua-cua; Catalán: cuac-cuac; francés: coin-coin; italiano: qua-qua; portugués: qua-qua; inglés: 
quack-quack; alemán: quack-quack; holandés: kwak-kwak; servo-croata: kva-kva; finés: 
kvaak-kvaak; coreano: kkoyk-kkoyk; polaco: kwa-kwa; noruego: kvakk-kvakk; ruso: 
krya-krya; turco: vak-vak; vietnamita: quak-quak, etcétera. 


a Otro ejemplo contrario a la arbitrariedad es la palabra 
diferent z Ds 
AS «mamá», para designar familiarmente a la madre (Tabla 


Español: mamá Rumano: mama , , 

bras el aña 2-1), que en un gran número de lenguas, de orígenes muy 
Portugués: mama Polaco: mama distantes, incluye siempre el sonido nasal labial /m/. En 
Italiano: mamma Húngaro: mama inión de 1 Ñ A drí lació 1 
males min Mesias opinión de los lingúistas, esto podría tener relación con e 
Alemán: mama Africaner: ma sonido que el bebé produce durante el amamantamiento. 
Sueco: mamma Quechua: mama Ñ A . a 

Do Saki mama Algunos autores investigan la posible relación entre 


ciertos sonidos del lenguaje y algunas propiedades de los 
objetos representados. Esta hipotética relación es conocida como el simbolismo fonético. Así, 
consideran que el sonido de ciertas vocales, como la «i» inglesa, cuyo sonido es agudo y corto, 
está asociado a cosas pequeñas: 'little', 'tiny', 'mini'; mientras que vocales largas y graves se 
asocian con cosas grandes: 'huge', large", 'macro' (Brown, Black, y Horowitz, 1955). Pero no 
faltan las excepciones, como 'big' y 'small'. En todo caso, tanto las onomatopeyas, como el 
posible simbolismo fonético de los fonemas constituyen un aspecto menor respecto a la 
poderosa arbitrariedad general del signo lingúístico. 
Productividad o creatividad. Esta es la característica más importante y, a la vez, más dis- 
tintiva del lenguaje humano. Al contrario que otros animales, el ser humano puede producir 
infinitas oraciones y comunicar información de lo más variopinta, transmitir un número 
ilimitado de ideas, hechos, sentimientos, etc. La capacidad productiva o creadora del lenguaje 
humano es asombrosa y, al mismo tiempo, singular, sin paralelo en las demás especies del pla- 
neta. El número de oraciones posibles no tiene límite; existen diccionarios de palabras, pero no 
de oraciones. A nadie se le ocurre listar el conjunto completo de oraciones de un idioma, 
sencillamente, porque son ilimitadas. Por otra parte, un hablante puede entender frases que no 
ha oído antes. 
Esta enorme productividad ocurre gracias a las dos propiedades anteriores y a una nueva que 
se expone a continuación. A la arbitrariedad del signo, que libera al lenguaje de la semejanza 
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física con el mundo referenciado, y la dualidad de estructura, que permite millones de 
combinaciones posibles de palabras, se suma la recursividad del lenguaje humano. Para 
explicarlo, vamos a seguir los ejemplos que propone con humor Steven Pinker en su libro El 
instinto del lenguaje (Pinker, 1995): 
El Libro Guinnes de los Records afirmó haber encontrado la frase más larga en inglés 
(1.300 palabras): «Ambos lo llevaban como presas de una flagrante exaltación 
deliberada...» (en ¡Absalón, Absalón!, novela de William Faulkner). 
Pinker dice: «Me veo tentado a pasar a la posterioridad rompiendo el record con la 
frase: "Faulkner escribió: Ambos lo llevaban como presas de una flagrante exaltación 
deliberada..."». 
Pero esa marca caería de inmediato con otro que dijera: «¿A quien diablos le importa 
que Pinker dijera que Faulkner escribió: Ambos lo llevaban como presas de una 
flagrante exaltación deliberada...». 
Es decir, las oraciones están construidas de acuerdo con unas reglas básicas que pueden 
aplicarse sobre sí mismas de forma recursiva. Es como el juego de las construcciones, donde el 
ensamble de piezas o bloques da lugar a nuevos bloques de construcción que, a su vez, pueden 
ensamblarse entre sí. Cada oración (O) se construye de acuerdo con la regla básica: 
O>SN+SV 
donde SN es un sintagma nominal, generalmente en papel de sujeto, y SV un sintagma verbal, 
en papel de predicado. Pero, a su vez, cada SV puede estar formado por: 
SV> V + SN 
donde V es verbo. También puede estar formado por: 
SV>V+0 
Y aquí ya tenemos la recursividad, puesto que sobre la oración se vuelve a aplicar la primera 
regla del principio. Por ejemplo, «Pedro está muy enfermo» es una oración, mientras que en 
«La madre sabe que Pedro está muy enfermo», hay una oración dentro de otra, formando una 
nueva oración. Este proceso puede continuar: «Yo sospecho que la madre sabe que Pedro está 
muy enfermo» es otra nueva oración formada sobre las anteriores. 
De esta manera, si no fueran suficientes los millones de combinaciones que pueden formar las 
palabras, la recursividad añade nuevas posibilidades que hace que, en la práctica, el número de 
oraciones posibles de una lengua se considere ilimitado. 
Algunos autores, como Noam Chomsky y los psicobiólogos Hauser y Fitch, creen que la 
recursividad sería el verdadero núcleo duro del lenguaje, lo esencialmente único desde el 
punto de vista humano (Hauser, Chomsky y Fitch, 2002). Esta es una visión restrictiva que no 
todos comparten; otros autores extienden el reconocimiento de singularidad a más aspectos del 
lenguaje (Pinker y Jackendoff, 2005). 


ORIGEN Y DIVERSIDAD DEL LENGUAJE 


Aunque existe una gran variedad de lenguas en el mundo muy diferentes entre sí, todas 
comparten la gran complejidad gramatical y su diferencia cualitativa con cualquier lenguaje 
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animal. No existen lenguas más primitivas o más avanzadas que otras, simplemente hay 
lenguas diferentes. Posiblemente haya un tronco común en todas ellas que se remonta a los 
momentos en que los seres humanos empezaron a utilizar el lenguaje, aunque es difícil 
encontrarlo. 

¿Cómo y cuándo se originó el lenguaje humano? Se trata de una cuestión aún abierta, porque el 
lenguaje, al contrario de lo que sucede con las herramientas, no deja restos fósiles. Por otra 
parte, la ausencia de un homólogo claro en el mundo animal cierra la posibilidad de estudios 
comparativos que arrojen alguna luz sobre su evolución filogenética. Como resultado de todo 
ello, la discusión sobre los orígenes del lenguaje abunda más en conjeturas que en datos reales. 


Recuadro 2-1. Polémica en torno a la evolución del lenguaje 


En el siglo XIX la evolución del lenguaje fue objeto de encendidas disputas cargadas de 
connotaciones filosófico-religiosas, hasta el punto que la Société de Linguistique de París 
prohibió expresamente cualquier debate sobre el tema, a fin de preservar el normal discurrir 
de sus reuniones. Esto ocurría en 1866, siete años después de que Darwin publicara el Origen 
de las especies. Los estatutos de dicha sociedad, aprobados el 8 de marzo de ese año, decían 
literalmente: 

Artículo 1. La Société de Linguistique tiene como fin el estudio de las lenguas, sus leyendas, 
tradiciones, costumbres, documentos, para enriquecer la ciencia etnográfica. Cualquier otro 
objeto de estudio está rigurosamente prohibido. 

Artículo 2. La Société de Linguistique no admitirá ninguna comunicación concerniente al 
origen del lenguaje o a la creación de una lengua universal. 

El ejemplo cundiría y, en 1873, la Philosophical Societáe Londres adoptó una medida similar. 
Por fortuna, como cabía esperar, la prohibición no ha perdurado hasta nuestros días, y la 
ciencia contemporánea dedica una importante atención al asunto, espoleada por nuevos 
descubrimientos arqueológicos y paleontológicos. Sirva de referente la Conferencia 
Internacional sobre Evolución del Lenguaje que, cada dos años, se celebra en algún lugar del 
mundo. 


+  Conjeturas tradicionales 
Tradicionalmente se han considerado cinco teorías que han elucubrado sobre el origen del 
lenguaje humano. Siguiendo la revisión de David Crystal (1994), cabe citar las siguientes, 
denominadas según sus rasgos un tanto pintorescos. 
Teoría del «guau-guau». El origen del lenguaje estaría en las onomatopeyas; es decir, en la 
imitación de los sonidos de la naturaleza, en especial, de los animales. La teoría tendría poco 
apoyo empírico, porque las onomatopeyas constituyen una parcela marginal y restringida 
dentro del vocabulario de cualquier lengua. 
Teoría del «ay-ay». La raíz inicial del lenguaje la constituirían las interjecciones, es decir, los 
sonidos instintivos provocados por las propias emociones de dolor, ira, angustia, etc. Darwin 
fue uno de los defensores de esta teoría; su base es también endeble, porque las interjecciones 
son escasas en todas las lenguas, y los sonidos fisiológicos (inspiraciones, gritos de dolor, etc.) 
guardan poca relación con las vocales y consonantes. 
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Teoría del «ding-dong». El lingúista Max Múller defendía que el lenguaje se origina en las 
«conexiones naturales», no arbitrarias, entre sonidos y significados. Por ejemplo, los objetos 
pequeños irían asociados naturalmente a sonidos agudos como la vocal /i/ («ding»); los 
grandes, a sonidos graves como la /o/ («dong»). El lenguaje surgió porque los seres humanos 
reaccionaron a los estímulos del mundo produciendo de forma espontánea los sonidos 
conectados a ellos. Hoy sabemos que, salvo pocas excepciones, el lenguaje humano es 
primordialmente arbitrario. 
Teoría del «aaah-hú». El lenguaje surgió del trabajo físico, es decir, de los gruñidos 
colectivos y rítmicos que las personas emitían debido al esfuerzo cuando trabajaban juntas. 
Con el tiempo se convertirían en cantos más complejos y, finalmente, en lenguaje. La teoría 
esgrime a su favor el hecho de que la base entonacional o prosódica es universal en las lenguas 
del mundo, pues todas utilizan las mismas entonaciones básicas para preguntar, exclamar, etc. 
Deja sin explicar, empero, la naturaleza esencialmente simbólica del lenguaje. 
Teoría del «la-la». Propuesta por el lingijista danés Jespersen, consideraba que el lenguaje 
surgió del lado romántico de la vida, a partir de sonidos asociados con el amor, el juego, la 
canción, la risa, etc. Al contrario que la anterior, los primeros sonidos no serían gruñidos 
cortos, sino largos y musicales. No obstante, esta teoría no explica la diferencia entre los 
componentes emocionales y los cognitivos o simbólicos del lenguaje. 
Además de estas cinco teorías, frecuentemente citadas, cabe añadir otras que ponen el acento 
en nuevas explicaciones. Así, la teoría delHeyyou, defendida por el lingiiista Revesz, sitúa el 
origen en los sonidos vocales que señalan la identidad y ubicación de los hablantes. La teoría 
del eureka, considera que el lenguaje fue inventado de forma consciente por los seres 
humanos, quienes, de forma deliberada, asociaron arbitrariamente determinados sonidos a las 
cosas. 

+ Evidencias empíricas 
Aunque el lenguaje no deja fósiles directos, hay dos líneas de trabajo que buscan conclusiones 
sobre nuestros antepasados: el tamaño del cerebro en sus áreas corticales responsables del 
lenguaje, y la evolución del aparato fonoarticulador. En el primer caso, moldes de yeso y 
programas informáticos permiten reconstruir la forma aproximada del cerebro a partir de las 
cavidades internas de los cráneos. En el segundo, los fósiles preservan la mandíbula y la forma 
aproximada de la cavidad oral, aunque no los tejidos blandos como la lengua, la laringe y otras 
estructuras. En este caso, las conclusiones pueden beneficiarse de comparaciones con la 
anatomía vocal de los chimpancés y los bebés humanos. 
Por otra parte, los paleoantropólogos, en colaboración con lingúistas y psicobiólogos, no cesan 
de buscar nuevas fuentes de evidencia. Una de ellas es el estudio del canal hipogloso del 
cráneo, u orificio que en los mamíferos permite el paso del nervio craneal (par XI!) que inerva 
los músculos de la lengua (Kay, Cartmill y Barlow, 1998). En los seres humanos este orificio 
es más ancho que en los primates africanos (chimpancés y gorilas), probablemente porque el 
nervio también lo es -tiene más fibras nerviosas- al inervar a la lengua de forma más rica para 
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controlar los complejos movimientos articulatorios del habla. Por ahora, los resultados 
respecto a nuestros antepasados son controvertidos. 
+ Aparición temprana frente a tardía 

Hoy no se cuestiona que el Australopithecus apareció en África hace unos 6 millones de años 
(la famosa Lucy). Hace unos 1,6 millones evolucionó el Homo erectus y se dispersó por Asia y 
Europa, dejando objetos y restos fósiles en ambos continentes. Nuestra especie, el Homo 
sapiens, se separó de aquél y adquirió la forma actual probablemente hace unos 150.000 años. 
¿En qué momento de este largo proceso apareció en escena algo comparable al lenguaje 
actual? La comunidad científica no acaba de ponerse de acuerdo en este punto. Suddendorf 
(1999) revisó las teorías contemporáneas y las clasificó en dos grandes grupos: las que 
defienden una aparición temprana del lenguaje en la evolución humana, y las que abogan por 
una aparición relativamente tardía. 

En el primer grupo, hay autores, como Pinker (1995), que consideran que el lenguaje empezó a 
desarrollarse en una fase muy temprana de la evolución de los homínidos, tal vez hace 5 
millones de años. Otras versiones más moderadas hablan de una lenta evolución de las 
capacidades de representación mental y manejo de símbolos a lo largo de los últimos 2 
millones de años. Los cráneos fósiles apoyan la existencia de un área cerebral de Broca 
semejante a la actual hace 2 millones de años (Holloway, 1996). El canal hipogloso del 
Australopithecus se parece más al de los monos que al de los seres humanos actuales, pero el 
de los neandertales de hace 400.000 años se asemeja al actual (Kay, Cartmill, Balow, 1998). 
Sin embargo, estas conclusiones no están exentas de críticas. Por otra parte, Corballis (2002) 
entiende que el lenguaje evolucionó desde la comunicación gestual, es decir, a partir de los 
gestos de las manos de nuestros antepasados homínidos. En este paso «de la mano a la boca», 
nuestros ancestros habrían usado en un principio vocalizaciones y gestos manuales para 
comunicarse entre sí; con el paso a la bipedestación -que deja la mano libre- y el aumento del 
tamaño cerebral, esta forma de comunicación aumentaría en complejidad, adquiriendo las 
características del lenguaje actual: referentes simbólicos, una gramática y una sintaxis. Al 
mismo tiempo, se iría produciendo un cambio en la importancia relativa de ambos medios 
expresivos, ganando terreno las vocalizaciones sobre los gestos. Según este autor, el hecho de 
que el lenguaje comparta conexiones neurales con el sistema motor, la expresividad gestual de 
los primates y su sentido de la vista más desarrollado que el auditivo fortalecerían su hipótesis. 
En el grupo de las teorías defensoras de la aparición tardía, algunos autores sostienen que el 
lenguaje evolucionó de una forma relativamente abrupta y reciente en el tiempo. Para 
Bickerton (1995), es imposible concebir la gramática como algo que surge y se forma de modo 
gradual, por incrementos sucesivos; es muy probable que una única mutación causara la 
emergencia brusca de la sintaxis. Bickerton y otros autores creen que este fenómeno habría 
coincidido con la aparición del Homo sapiens en África, hace tan sólo unos 150.000 años. 
Según la revisión que hace Lieberman (1998), los fósiles indican que el aparato vocal 
necesario para producir lenguaje articulado mo aparece hasta una fase ya avanzada, 
coincidiendo con la aparición del Homo sapiens. Por otro lado, las primeras pruebas claras de 
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que el ser humano era capaz de representaciones simbólicas (pinturas rupestres, ornamentos, 
etc.) datan de hace unos 40.000 años, en el Paleolítico, y la primera evidencia incontrovertible 
de lenguaje es de hace sólo 5.500 años (las primeras escrituras). Ese gran paréntesis entre la 
aparición de la especie actual (H. sapiens) y el surgimiento del pensamiento simbólico 
apoyaría, según estos autores, la evolución muy reciente del lenguaje, gracias sobre todo a la 
interacción social y la emergencia de una teoría de la mente, o capacidad de inferir estados 
mentales en los otros. 
En el fondo de estas aproximaciones teóricas laten concepciones distintas acerca del papel 
adaptativo que el lenguaje habría desempeñado en la evolución de la especie. Para la mayoría 
de los teóricos «tempranos» sobre la evolución del lenguaje, éste habría surgido por selección 
natural darwiniana, favoreciendo la supervivencia al aumentar la eficacia de las actividades 
cooperativas y la transmisión de información. Como señalan Pinker y Bloom (1990), es muy 
distinto que una zona tenga animales que «se» puedan comer, a animales que «te» puedan 
comer, y la capacidad para comunicar esta distinción, y otros tipos de representaciones 
mentales, obra a favor de la supervivencia. Para Corballis (2002), la evolución del lenguaje 
liberó las manos de los gestos comunicativos y permitió el uso de las herramientas durante la 
comunicación. Entre los teóricos «tardíos», sin embargo, se abriga la idea de que tal vez el 
lenguaje, y más en concreto, la gramática, no surgió por selección natural, sino como un 
«accidente» mutacional o un subproducto del crecimiento del cerebro. Consideran que no ha 
habido tiempo suficiente para que evolucionara algo tan complejo como la gramática y que 
ésta no puede existir de forma intermedia, al ser más bien un proceso de todo o nada (o se tiene 
una gramática o no se tiene). Y, a su vez, la posesión de una gramática no conferiría per se 
ninguna ventaja evolutiva. 
Hoy, el debate entre teóricos «tempranos» y «tardíos» sobre la evolución del lenguaje perma- 
nece abierto. No obstante, como señala certeramente Suddendorf (1999), con independencia 
de la veracidad de cada explicación, sólo las teorías «tardías» pueden ser refutadas claramente 
por los datos. Por ejemplo, el descubrimiento de una prueba de representación simbólica de 
hace 250.000 años rebatiría la hipótesis del nacimiento tardío (40.000 años) de ésta. Pero, no 
es posible lo contrario para refutar las teorías tempranas, porque, como es sabido, en ciencia la 
ausencia de evidencia no es evidencia de la ausencia. 

+ Lenguas en el mundo 
¿Cuántas lenguas hay en el mundo? Es difícil contestar con una cifra concreta, porque ésta 
depende de cómo hagan los recuentos los lingilistas. La respuesta puede variar; en líneas 
generales puede decirse que en torno a unas 6.000 lenguas, de las cuales la mitad está en 
peligro de desaparición. Donde un lingiiista considera dos dialectos de la misma lengua, otro 
puede contarlos como dos lenguas distintas. ¿Consideramos el macedonio y el búlgaro como 
dos lenguas diferentes o como dos variantes de una única lengua? A veces los criterios que 
guían estas decisiones dependen de razones extralingúísticas (políticas). Por ejemplo, el serbio 
y el croata son muy próximos y pueden considerarse dialectos de la misma lengua 
serbo-croata, pero utilizan alfabetos distintos y hoy pertenecen a países separados, por lo que 
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en algunos recuentos figuran como dos lenguas. En el Líbano, algunos partidos de la derecha 
sostienen que el «libanes» no es árabe y pretenden reemplazar la escritura árabe por el antiguo 
alfabeto fenicio. En España, algunos políticos insisten, contra toda evidencia, en que el 
valenciano y el catalán son dos lenguas distintas e independientes (afortunadamente, los 
mallorquines no pretenden otro tanto). 

De acuerdo con la Linguistic Society of America, el catálogo más extenso se debe a la 
organización Ethnologue (www.ethnologue.com), que en 2013 listaba un total de 7.106 
lenguas. Su distribución geográfica es muy poco uniforme; así, de todas ellas, sólo 285 se 
hablan en Europa, mientras que Asia cuenta con 2.303 lenguas (Anderson, 2004). Un área de 
particular diversidad lingúística es la isla de Papua-Nueva Guinea, donde se calculan más de 
800 lenguas distintas habladas por menos de 4 millones de habitantes. 

La distribución del número de hablantes también es muy desigual: desde el chino mandarín, 
hablado por más de 800 millones de seres humanos, hasta lenguas indígenas de Norteamérica 
que las hablan un puñado de personas. Se vaticina que más de 3.000 lenguas desaparecerán en 
el presente siglo. Uno de los lingiistas más destacados en este campo, David Crystal, estima 
que cada dos semanas muere una lengua, y alerta sobre la necesidad de preservar las lenguas 
minoritarias y su convivencia con las lenguas francas (Crystal, 2004). Cuando una lengua no 
se enseña a los niños de la comunidad, sus días están contados como consecuencia de la 
presión de otra lengua dominante. En opinión de Anderson (2004), cuando una lengua muere, 
en cierto modo, todo un mundo muere con ella, porque desaparece su función de conexión con 
el pasado y las experiencias de una colectividad humana. 

Las lenguas cambian y evolucionan con el tiempo. Así, cuando el Imperio Romano se 
desmembró en el siglo v de nuestra era, sus diversas regiones quedaron aisladas y el latín 
evolucionó de formas distintas, dando lugar más tarde a las lenguas romances: italiano, 
castellano, francés, catalán, gallego-portugués, rumano, etc. Del persa antiguo surgieron los 
actuales farsi, kurdo y pastún. Los lingiiistas agrupan las lenguas en conjuntos con un ancestro 
común y, a su vez, estos conjuntos forman parte de grandes familias lingiiísticas. 

Cuando, en un momento dado de la historia, una comunidad humana se separa en dos grupos 
distintos, la lengua de la comunidad evoluciona en cada grupo de forma independiente y, con 
el tiempo, ambas devienen en lenguas distintas, aunque emparentadas entre sí (hermanas). 
Actúan las fuerzas que los filólogos han denominado de deriva lingúística. Del mismo modo 
que las mitades de un cuerpo flotante en el mar se distancian cada vez más a medida que pasan 
los días, las lenguas y las dotaciones genéticas de los grupos humanos difieren cada vez más 
según transcurre el tiempo desde su separación. En ausencia de otros factores perturbadores, se 
puede estimar el momento de la separación de las comunidades a partir de los cambios sufridos 
en los vocabularios respectivos. El lingiista Morris Swadesh calculó que las lenguas 
indoeuropeas han tenido un ritmo de cambio de aproximadamente un 14% cada milenio. 
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Tabla 2-2. Las veinte lenguas más habladas del mundo 


Hablantes z 
Lengua Familia nativos Areas donde se habla 
(millones) 
1 Chino mandarin Sino-tibetana 850 China, Malasia, Taiwán 
2 Español Indoeuropea 414 Sudamérica, Centroamérica, España 
3 Inglés Indoeuropea 335 Estados Unidos, Reino Unido, Australia, 
Canadá, Nueva Zelanda 
4 Hindi Afroasiática 260 Norte y centro de India 
5 Árabe Indoeuropea 237 Oriente Medio, Arabia, norte de África 
6 Portugués Indoeuropea 203 Brasil, Portugal, sur de África 
7 Bengalí Indoeuropea 193 Bangladesh, este de India 
8 Ruso Indoeuropea 167 Rusia, Asia central 
9 Japonés Altaica 122 Japón 
10 Javanés Malayo-Polinesia 84 Indonesia, Malasia, Singapur 
11 Lahnda Indoeuropea 83 Pakistán 
12 Alemán Indoeuropea 78 Alemania, Austria, Europa central 
13 Coreano Altaica 77 Corea 
14 Francés Indoeuropea 75 Francia, Canadá, oeste y centro de África 
15 Telugu Drávida 74 Sur de India 
16 Marati Indoeuropea 72 Oeste de India 
17 Turco Altaica 71 Turquía, Asia central 
18 Tamil Drávida 69 Sur de India 
19 Vietnamita Austroasiática 68 Vietnam, China 
20 Urdu Indoeuropea 64 Pakistán 


Tomado de Paul LM, Simons GF, Fennig CD, eds. Ethnologue: languages of the world, 17* ed. Dallas, Texas: SIL International, 2014. Versión 
on line: http://www.ethnologue.com. 


Las grandes familias lingúísticas tienen su origen en ancestros comunes que se dispersaron, 
generalmente como consecuencia de grandes movimientos migratorios. Por ejemplo, el tronco 
altaico agrupa a lenguas aparentemente tan dispares como el turco, el mongol, el coreano y el 
japonés. Su origen se remonta a gentes nómadas de las estepas de Asia central que migraron, 
unos hacia el oeste, dando lugar al turco, al azerí, al uzbeco y a otras lenguas de las repúblicas 
del Cáucaso, y otros hacia el este, hasta la península coreana y las islas japonesas. Pese a su 
diversidad, todos los lenguajes altaicos conservan elementos que recuerdan su origen común: 
sus sistemas vocálicos tienen la propiedad denominada armonía vocal, que divide a las vocales 
en dos grupos distintos; los sufijos se aglutinan, se «pegan» unos detrás de otros conservando 
su entidad individual (p. ej., «casa» en turco es «ev» y casas: «evler», nuestras casas: «evler 
imiz», a nuestras casas: «evlerimize»); no tienen preposiciones, sino posposiciones; no hay 
géneros gramaticales ni artículos, etcétera. 

Por otra parte, son comunes los «préstamos» de palabras entre las lenguas. Así, el castellano 
desciende del latín y, por lo tanto, la mayor parte de su vocabulario procede de él, pero un gran 
número de palabras, algunas muy habituales (¿sabía el lector que coche es de origen húnga- 
ro?), se han incorporado desde otros dominios lingiiísticos, como reflejo de distintos avatares 
históricos (ocupación árabe, descubrimiento del Nuevo Mundo, etc.). 
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En el recuadro 2-2 se muestran algunos ejemplos de vocablos castellanos de origen no latino 
extraídos del Diccionario de la Real Academia Española, en su 22a edición (DRAE, 2003, 
edición electrónica). 


Recuadro 2-2. Ejemplos de palabras castellanas de origen no latino 
Lenguas indoeuropeas 
+ Catalán: añoranza, cantimplora, capicúa, faena, panoli. 


* Gallego: cachear, choza. 

* Francés: coronel, galán, cremallera, paquete. 

* Portugués: barullo, mejillón, regañar, volcán. 

* Italiano: alarma, balcón, pedante, riesgo. 

* Griego: anemia, clítoris, hipnosis, páncreas, tanatorio. 

» Inglés: conectar, fútbol, gasolina, suéter, tranvía. 

+ Alemán: acordeón, bigote, cobalto, hámster, nazi. 

+ Holandés: duna, escaparate. 

* Islandés: geiser. 

* Sueco: tungsteno. 

* Ruso: zar. 

* Hindi: parchís. 

+ Caló: chaval, chungo, gachí, paripé. 

» Persa: bazar. 

Lenguas amerindias 

+ Maya: cigarro. 

+ Caribe: boniato, caoba, colibrí, loro, sabana. 

* Cumanagoto: butaca. 

* Tupí: cobaya. 

* Guaraní: maraca, tapioca. 

* Nahua: aguacate, cacahuete, cacao, chapapote, chicle, petaca, petate, tomate. 

* Taino: canoa. 

* Quechua: cancha, coca, cóndor, guanaco, guano, mate, papa, puma. 

* Inca: porro. 

Lenguas camito-semíticas 

+ Hebreo: cabala, edén. 

+ Árabe (más de 1.000 palabras): aceite, aceituna, acelga, acequia, acicate, adobe, adoquín, 
aduana, ajedrez, alacena, alacrán, albañil, albaricoque, albufera, alcachofa, alcoba, alcohol, 
alfombra, algodón, almacén, almohada, almuerzo, alquiler, alquitrán, alubia, arroz, asesino, 
atún, azar, azotea, azúcar, barrio, droga, enchufar, guitarra, hachís, hasta, jarabe, jarra, jinete, 
limón, marfil, mazapán, mazmorra, mezquita, momia, noria, ojalá, rehén, rincón, sandía, 
tabaco, tarima, zumo. 


Lenguas uralo-altaicas 
* Finés: sauna, tundra. 
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* Húngaro: coche. 

* Turco: sultán, zapato. 

Lenguas malayo-polinesias 

+ Malayo: cacatúa, orangután. 

+ Maori: kiwi. 

* Polinesio: tabú. 

Otras lenguas 

* Vasco: aquelarre, bacalao, chabola, chistera, ganzúa, guiri, mus, zurrón. 
* Lenguas prerromanas: barro, bruja, galápago, grava, moño, muñeca, sapo. 
* Japonés: bonsái, geisha, haraquiri, kamikaze, karaoke, soja, yudo. 

* Chino: taichi, té. 

* Esquimal: anorak, iglú. 

* Lenguas africanas: banana, cola, vudú. 


La familia más estudiada ha sido la de las lenguas indoeuropeas. En 1786, Sir William Jones, 
un jurista destinado en la India, llamó la atención sobre las sorprendentes similitudes que 
parecía haber entre el sánscrito, el griego y el latín. Propuso que las tres lenguas habrían 
surgido de un antepasado común que, probablemente, ya había desaparecido tiempo atrás. 
Jones observaba que las raíces de los verbos y las formas gramaticales presentaban afinidades 
muy superiores a las que cabría esperar por mero azar. Los estudios sistemáticos posteriores 
confirmaron esta hipótesis, y hoy se acepta la existencia de un «protoindoeuropeo», o lengua 
que se habría hablado hace unos 6.000 años y de la que habrían derivado idiomas tan distantes 
como los actuales español, inglés, sueco, ruso, hindi o persa. Todos ellos serían parientes entre 
sí gracias a un origen común que se expandió, a través de grandes migraciones humanas y la 
difusión de la agricultura, por vastas zonas de Europa y Asia. A veces, los parecidos son 
sorprendentes: 'water' en inglés, 'waser' en alemán y 'watar' nada menos que en hitita. 


EL LENGUAJE DE LOS ANIMALES 

¿Tienen lenguaje los animales? Como hemos mencionado, el lenguaje humano con sus tres 
propiedades esenciales de arbitrariedad, dualidad de estructura y enorme productividad es, 
claramente, un hecho singular dentro del reino animal. No obstante, muchas especies animales 
están dotadas de eficientes sistemas de comunicación. Recordemos, por ejemplo, las danzas de 
las abejas para comunicar emplazamientos lejanos de flores. 

En este sentido, comunicación tiene un significado más amplio que lenguaje: transmisión de 
una señal (sonido, olor) portadora de información. Algunos autores distinguen entre señal 
comunicativa y señal meramente informativa. La primera incorporaría cierto componente de 
racionalidad (muy discutido) en la transmisión de la información. Si un animal hace ruido 
accidentalmente en su aproximación a otro, está transmitiendo información sobre su presencia, 
pero no hay un acto intencional de comunicación. Cuando un pájaro macho produce un sonido 
vocal «con la intención» de atraer a la hembra, está realizando un acto de comunicación. Sin 
embargo, muchos autores consideran la comunicación en su sentido más amplio, sin que 
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implique necesariamente la intención del receptor. En ese sentido se hablaría de comunicación 
electroquímica entre neuronas, o comunicación químico-olfativa cuando se sincronizan los 
ciclos menstruales de mujeres que conviven juntas en una casa o en dormitorios colectivos. 
Ahora bien, desde el punto de vista científico, se debe ser cauto a la hora de atribuir a los 
animales propiedades antropomórficas como la intencionalidad, al menos en el sentido que 
tiene para nuestra especie (véase Consideraciones generales sobre la comunicación en los 
animales, más adelante). 
Comunicación es un concepto amplio que ha tenido múltiples definiciones. Una de ellas, 
reciente, considera que la comunicación es «la transmisión de información desde un emisor a 
un receptor, de manera que ambos, receptor y emisor, se benefician» (Bradbury y 
Vehrencamp, 1998). En términos operativos, para Wilson (1975) la comunicación «ocurre 
cuando, a través del envío de una señal, un organismo es percibido por otro y se altera la 
probabilidad de un patrón de conducta adaptativa en el receptor de la señal, o en ambos». La 
mayoría de las definiciones incorporan el concepto de cambio de conducta por parte del 
organismo receptor, siendo este cambio adaptativo a las condiciones de la situación y, por lo 
tanto, beneficioso. 

* Modalidades sensoriales 
La comunicación animal ocurre a través de diferentes modalidades sensoriales: acústica, 
visual, químico-olfativa, eléctrica, etc. Cada modalidad tiene unas características propias, con 
ventajas e inconvenientes particulares. Por ejemplo, la comunicación visual suele ocurrir a 
distancias más cortas que la auditiva, pero admite «línea directa» entre los dos organismos y 
posibilidad de mayor privacidad frente a otros. La comunicación acústica alcanza mayores 
distancias y no suele interrumpirse por obstáculos, pero tiene poca privacidad y es menos 
selectiva respecto al receptor. La señal olfativa no es transitoria y persiste a largo plazo; es más 
una «escritura», por su permanencia temporal. La comunicación eléctrica de algunas especies 
de peces ocurre a distancias relativamente cortas. 
La comunicación química u olfativa, aunque es relativamente persistente, transmite la 
información de modo más lento que la visual o la auditiva. Su intensidad sigue un gradiente 
que se debilita con la distancia y, a menudo, tiene una distribución irregular en el espacio, 
dependiendo de las características del entorno (vientos, medios aéreos). El emisor puede 
«marcar» de modo permanente zonas de su territorio (felinos, cérvidos, etc.) o emitir señales 
químicas de forma móvil en su desplazamiento (hormigas). Las señales químicas se deben a 
moléculas orgánicas volátiles, de bajo peso molecular -entre 5 y 20 átomos de carbono- que se 
difunden con facilidad en el medio y son producidas por las feromonas, o mensajeros químicos 
que regulan la comunicación dentro de una especie. En este caso, la tarea del receptor es más 
simple que en las señales acústicas o visuales, que suelen requerir un paso previo de análisis de 
sus componentes espectrales (frecuencias acústicas, longitudes de onda) y transducción a 
energía electroquímica, que es la que utiliza el sistema nervioso. Las moléculas olfativas se 
incorporan directamente, a través de reacciones químicas, a las proteínas de los órganos 
receptores. En algunas especies la sensibilidad del receptor es extraordinaria. Por ejemplo, las 
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antenas de las mariposas de la seda pueden detectar la presencia en el aire de una única 
molécula individual. 

En la comunicación visual, los animales exhiben elementos visuales, que pueden ser 
estructurales o conductuales. Así, el tamaño de la cornamenta de un ciervo es un elemento 
estructural que comunica a otros machos, potencialmente competidores, cuan poderoso es su 
dueño. El despliegue de la cola del pavo real es un elemento conductual. Muchas aves tienen 
plumas con pigmentaciones brillantes para la atracción de sus parejas sexuales: melaninas 
responsables de los colores negro y marrón; carotenoides para el rojo, naranja, amarillo, etc. 
Las danzas de las abejas o las conductas de galanteo del salmón son también formas de 
comunicación visual a través del comportamiento. 

En la comunicación acústica, la producción del sonido exige la presencia de un elemento 
vibratorio, generalmente una membrana, que comunica la energía mecánica a las moléculas 
del fluido circundante, sea aire o agua. Los mecanismos son muy diversos: desde la 
estridulación o frotamiento de dos estructuras en algunos insectos, hasta la vibración de la 
vejiga natatoria en ciertos peces O las respuestas vocales de cierta complejidad en los 
vertebrados. En éstos, particularmente mamíferos, aves y algunos anfibios, se utiliza la presión 
producida por los pulmones como fuente de energía para la generación de una onda por 
membranas vibratorias (cuerdas vocales, siringe). Se trata de la misma modalidad que utiliza 
el lenguaje humano y la que emplean algunas especies próximas a la humana. 

La comunicación acústica entre animales se estudia desde la bioacústica mediante grabaciones 
de alta calidad y su posterior análisis en el laboratorio. Los expertos intentan identificar rasgos 
característicos y, en algunos casos, clasificar los sonidos en categorías discretas, 
configurándolos a modo de «vocabulario» propio de cada especie animal. Cuando es posible la 
categorización, los vocabularios de mayor tamaño aparecen en las aves y en los mamíferos. 
Las primeras utilizan entre 5 y 15 categorías sonoras distintas y los segundos entre 5 y 30 
(Miller, 1984). En http://www.findsounds.com/types.html pueden oírse sonidos de todo tipo 
de animales. 

Chimpancés 

Es el animal evolutivamente más próximo al ser humano y, junto a otros grandes monos y los 
delfines, uno de los animales no humanos más inteligentes. Es lógico que, desde una 
perspectiva lingúística comparada, las primeras miradas se dirigieran a esta especie. El estudio 
más extenso sobre la vida de los chimpancés en libertad se debe a la primatóloga inglesa Jane 
Goodall, llevado a cabo en enclaves africanos a lo largo de más de 40 años (Goodall, 1990). 
Entre otros aspectos de su conducta, Goodall realizó numerosas observaciones acerca de la 
comunicación entre los miembros de un grupo. En los chimpancés salvajes se han encontrado 
aproximadamente dos o tres docenas de vocalizaciones distintas, pero aún se sabe poco sobre 
sus funciones exactas en la comunicación. Parece que la mayor parte de estas vocalizaciones 
se relacionan más con situaciones de interacción social, particularmente relaciones de 
dominancia social entre individuos, que con objetos o elementos del entorno (alimento, 
depredadores). 
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Aves 

Son vertebrados con repertorios complejos de sonidos, que alcanzan su máxima expresión en 
los complicados cantos de las aves canoras o pájaros. Estos últimos son unas 4.500 especies 
del orden Passeriformes, de un total de 10.000 especies ornitológicas. En casi todas las aves el 
sonido se produce en la siringe, un órgano especializado que se encuentra al final de la tráquea, 
justo donde se bifurca para formar los bronquios. La siringe tiene un sistema de membranas 
que vibran al paso del aire procedente de los pulmones. Parece que, con ella, las aves generan 
dos sonidos simultáneos de forma separada; cuando cantan, en realidad producen dos voces a 
la vez, con frecuencias moduladas de forma independiente, en una especie de «dueto interno» 
indistinguible por nuestros oídos. Cada especie tiene unos patrones acústicos característicos y, 
en general, existe una relación inversa entre el tamaño del ave y el tono o frecuencia acústica 
de la respuesta vocal. Cuanto más pequeño el pájaro, más agudos los sonidos, y viceversa. 
En la mayoría se puede distinguir entre una serie de vocalizaciones cortas y el canto propia- 
mente dicho, este último casi siempre exclusivo de los machos y audible sólo en determinadas 
épocas del año. La investigación ha demostrado que el canto de las aves canoras cumple tres 
funciones principales: a) repeler a machos rivales; b) atraer a las hembras de la misma especie, 
y Cc) estimular la función reproductora de las hembras. 

Una evidencia de la primera función es que si se retira experimentalmente a un macho de su 
territorio, la grabación sonora de su canto es suficiente para mantener el territorio a salvo de 
machos intrusos. A la inversa, un macho enmudecido por procedimientos quirúrgicos tiene 
dificultades para mantener el dominio sobre su territorio. La evidencia sobre la función de 
atracción de las hembras es menos directa. Los machos «solteros», sin pareja, o aquellos que la 
han perdido previamente tienden a cantar más y, en muchas especies, dejan de hacerlo una vez 
que se han asociado a una hembra. En experimentos, es posible atrapar más hembras en 
cajas-nido cuando se usa un altavoz con grabaciones sonoras de los machos. La evidencia de la 
tercera función proviene del hecho de que las hembras que se hallan en un estado sexualmente 
receptivo, adoptan posiciones copulatorias cuando son expuestas a la grabación del canto de 
un macho de su especie. Incluso, en algunas especies, este tipo de conductas se extiende a la 
construcción del nido o a cambios internos en las respuestas fisiológicas de la hembra. 

Los cantos y vocalizaciones de las aves pueden codificar distintos tipos de información sobre 
la identidad del emisor. En primer lugar, al responder a patrones particulares de una especie, 
transmiten, obviamente, información sobre la identidad de la especie. Además, algunos 
trabajos han puesto de manifiesto características individuales del canto útiles para diferenciar 
entre individuos vecinos y extraños. Este reconocimiento individual cumple un papel 
importante en las interacciones entre padres y crías. También es común la existencia de 
variaciones geográficas en la estructura de los cantos de una misma especie, que dan lugar a 
«dialectos» asociados a determinadas áreas geográficas. 

Una cuestión que ha llamado recientemente la atención de los investigadores es si el canto de 
las aves implica una sintaxis, es decir si comparte uno de los rasgos supuestamente distintivos 
del lenguaje humano. Al menos algunos pájaros, como los estorninos y ciertas especies de 
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pinzones, parecen utilizar mecanismos recursivos en la composición de sus cantos. Así, las 
notas individuales se combinan en secuencias particulares de sílabas, las sílabas se combinan 
en motivos, y los motivos en el episodio completo del canto (Berwick et al., 2011; Corballis, 
2007), como ilustra la figura 2-3. 

Motivo | Sin embargo, para nuestra tranquilidad, la sintaxis del 
Nos Samer e === | canto de los pinzones es puramente fonológica, es decir, 
: no incorpora elementos con significado semántico, 
como las palabras o las oraciones, con lo cual se 
besa 05s salvaguarda la especificidad funcional de la sintaxis 
Figura 2-3. Espectrograma del canto de un pájaro humana. No obstante, éste es un matiz importante: no 
(especie pinzón cebra). El eje horizontal representa el 


tiempo y el vertical las frecuencias. Obsérvese la es- sería la sintaxis por sÍ misma la que hace que el lenguaje 


tructura recursiva del canto que incluye un motivo, 
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humana esté íntimamente vinculada a la semántica. 
Mamíferos marinos 
Un grupo de vertebrados que ha sido objeto de estudio es el de los mamíferos marinos, sobre 
todo las ballenas y los delfines. Al contrario de lo que pudiera pensarse, el medio acuático es 
un lugar bastante ruidoso en muchas partes del mundo por la presencia de organismos 
productores de sonidos, desde invertebrados como los camarones hasta los grandes mamíferos 
de sangre caliente (oreas, ballenas, delfines, marsopas, entre otros). Los sonidos acuáticos 
sirven de comunicación en una amplia variedad de situaciones. Por ejemplo, algunos peces 
emiten sonidos para atraer a sus potenciales parejas sexuales, espantar a depredadores o 
defender sus territorios. 
El sonido es un excelente canal de comunicación en el agua. Las ondas sonoras viajan cinco 
veces más rápido que en el aire, se atenúan más lentamente y pueden ser muy direccionales. 
No es extraño, por lo tanto, que, en la evolución de los mamíferos marinos, el sonido se 
convirtiera en el principal canal de comunicación. Sin embargo, la investigación en el medio 
hídrico presenta dificultades especiales. La observación se complica debido a que pocas 
especies son estacionarias durante largos períodos de tiempo y a que es difícil determinar la 
fuente de cada sonido cuando hay múltiples individuos en una zona. 
Los mamíferos marinos mejor estudiados comprenden pinnipedos (focas, leones marinos, 
morsas) y, sobre todo, cetáceos, en sus dos órdenes principales: odontocetos (cetáceos con 
dientes: cachalotes, oreas, marsopas, delfines) y misticetos (cetáceos con barbas: ballenas). 
Aunque emparentados, los odontocetos y los misticetos producen diferentes clases de sonidos 
y, probablemente, sus mecanismos de producción son distintos. En general, las vocalizaciones 
de los cetáceos pueden clasificarse en tres tipos acústicos: tonos, pulsos y clics. 
Los tonos, o llamadas tonales, comprenden silbidos o gemidos agudos, como en el caso de los 
delfines. Su estudio revela patrones característicos de cada especie. Además, los análisis 
espectrográficos han demostrado que, en ciertas especies de delfines, los silbidos codifican 
información acerca de la identidad de cada individuo, a modo de un nombre propio o «firma». 
Probablemente estas «firmas» individuales no son innatas, sino que se generan por un proceso 
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de aprendizaje. Parece que cada delfín desarrolla un silbido particular durante sus primeros 
meses de vida que es clave para su reconocimiento. Los datos indican que la madre desempeña 
un papel importante en este proceso: al nacer la cría, la progenitura emite sus silbidos 
constantemente para que pueda ser reconocida por aquélla y, al mismo tiempo, la cría aprende 
a desarrollar una versión propia del silbido. 
Muchas especies de misticetos, o ballenas, producen sonidos tonales, generalmente por debajo 
de los 2.000 ciclos por segundo. En los años setenta se descubrió la importancia de los 
denominados «cantos» de ballena en la cohesión social de los grupos durante la época de cría. 
Las llamadas pulsadas están formadas por la repetición de pulsos, sonidos muy breves y de 
espectro ancho (ruidos). Cuando se suceden de forma rápida, el oído humano no puede 
percibirlos por separado y se funden en sonidos complejos que asociamos a gruñidos, ladridos, 
gemidos, etc. Los pulsos son producidos por muchos odontocetos en situaciones de excitación 
o interacción social intensa, como en el caso de las oreas o «ballenas asesinas». Parece que 
cada manada de oreas emite patrones de pulsos característicos del grupo. 
Los clics son señales acústicas muy breves que permiten obtener información del entorno 
mediante el análisis de sus ecos (ecolocalización o biosonar). 
Al igual que en el canto de los pájaros, hace varias décadas se pusieron esperanzas en la 
posibilidad de encontrar algún tipo de gramática oculta en las vocalizaciones de los delfines: 
una especie de delfines o lenguaje propio de la especie. Dada su aparente inteligencia en 
muchas tareas, se pensó que los análisis acústicos pormenorizados de sus producciones 
vocales podrían desvelar alguna sintaxis o determinadas reglas de combinación de elementos 
sonoros discretos. Lo cierto es que hasta la fecha ningún dato empírico ha apuntado de forma 
clara en esta dirección. Como declaró el psicólogo John Morton a comienzos de los años 
setenta: 
En cuanto a la cuestión de si los delfines tienen un lenguaje, y en vista de las pruebas que 
conozco al respecto, lo único que puede decirse es que si efectivamente lo tienen, se están 
tomando mucho trabajo en ocultárnoslo (Morton, 1971, p. 83). 

+ ¿Comunicación simbólica? 
Con frecuencia los investigadores se han preguntado si en el mundo animal podría darse algún 
tipo de comunicación simbólica, es decir, el empleo de señales arbitrarias para designar 
objetos o eventos específicos, de manera que dichas señales no tuvieran una relación de 
semejanza física con lo representado. 
Al tratar esta cuestión siempre se cita una especie de primates que ha llamado la atención por 
su «vocabulario»: los monos vervet africanos o monos Tota. Muchos autores los consideran 
uno de los escasos ejemplos de referencia simbólica en animales no humanos. Estos monos 
usan un sistema de llamadas de alarma que permite distinguir entre distintos tipos de 
depredadores. Sus gritos no son simples expresiones de miedo, sino una especie de 
«protopalabras» o palabras primitivas que se asocian a objetos determinados (depredadores). 
Cuando un mono ve un águila, emite una llamada que semeja una tos o gruñido. Si descubre un 
leopardo, emite otro sonido parecido a un ladrido. Si se trata de una serpiente, la llamada de 
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alarma consiste en otro grito característico. Cada una de estas señales provoca que el resto de 
la manada emprenda conductas evasivas apropiadas a cada depredador. Ante una llamada de 
«águila», los monos miran hacia arriba y se ocultan entre los arbustos. En respuesta a una 
llamada «leopardo» corren rápidamente hacia los árboles y trepan a ellos para ponerse a salvo. 
Si se trata de «serpiente», los monos se yerguen sobre sus patas traseras y observan entre la 
hierba del suelo. Hay que decir que es muy importante elegir la conducta apropiada porque un 
error tendría consecuencias desastrosas. Si ante un águila el comportamiento más seguro es 
esconderse entre los arbustos, esto sería fatal si el depredador fuera un leopardo. 
Al principio se pensó que las llamadas de alarma no iban asociadas a cada tipo de depredador, 
sino que eran meras señales generales de alerta que hacían que los animales miraran a su 
alrededor y obraran en consecuencia una vez identificado el peligro. Sin embargo, una serie de 
experimentos diseñados por Robert Seyfarth y Dorothy Cheney, de la Universidad de 
Rockefeller, demostraron la especificidad de estas respuestas vocales. Así, por ejemplo, 
observaron que los monos producían la conducta evasiva apropiada ante grabaciones sonoras 
emitidas mediante un altavoz oculto y en ausencia de cualquier depredador (Seyfarth, Cheney 
y Marler, 1980). 
Se considera que el sistema de llamadas del mono vervet es simbólico porque las propiedades 
acústicas de cada tipo de señal no están físicamente relacionadas con el depredador o la 
conducta evasiva. Es decir, hay una relación sistemática -un determinado tipo de señal 2 0 
corresponde siempre al mismo tipo de depredador y conducta evasiva-, pero esta relación es 
arbitraria y, por lo tanto, simbólica. Por otra parte, este sistema de comunicación está 
predeterminado con poco espacio para el aprendizaje. De hecho, las llamadas de los individuos 
todavía inmaduros son muy parecidas a las de los adultos. Sí parece que, a medida que el 
individuo adquiere experiencia, hay un ajuste más fino en la identificación de los 
depredadores. Estudiando las llamadas de tipo «águila», Seyfarth y Cheney comprobaron que 
a veces son emitidas por individuos jóvenes ante especies parecidas no depredadoras, como 
los buitres. Son falsas alarmas, que generalmente no son tenidas en cuenta por el resto del 
grupo. 

* Consideraciones generales 
Basándonos en gran medida en la revisión de Seyfarth y Cheney (2003), conviene plantear 
algunas reflexiones generales sobre la comunicación animal en condiciones naturales. En 
primer lugar, parece que la selección natural ha favorecido a los animales emisores de llama- 
das que afectan a la conducta de un receptor y obtienen un beneficio de ello. Por ejemplo, una 
emisión vocal determinada de una rana macho causa la aproximación de una hembra de la mis- 
ma especie y ahuyenta a otros machos competidores. Al mismo tiempo, desde el punto de vista 
del receptor, la selección natural ha favorecido a los oyentes que detectan el nexo entre una 
llamada específica y un evento particular, logrando información también en beneficio propio 
(p. ej., la recepción de una llamada de alarma señalizadora de un depredador específico). 
Probablemente los mecanismos que obran en la adquisición de información no son distintos de 
los que ocurren en los experimentos de laboratorio sobre condicionamiento. 
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Durante mucho tiempo se han clasificado las señales según la dicotomía 
emocionales-referenciales. Las primeras transmitirían información sobre estados internos 
(emocionales) del emisor; las segundas irían asociadas a elementos del entorno, externos al 
emisor. En realidad, tal dicotomía es falsa, porque a menudo se encuentran señales de ambos 
tipos a la vez. De hecho, una señal puede llegar a ser informativa por mecanismos muy 
distintos. Un tono que indica a una rata la inminencia de un shock eléctrico en una caja de 
Skinner, o una llamada «leopardo» que señala a un mono verde la presencia de un leopardo, 
ambos tienen valor referencial gracias a mecanismos diferentes. Sin embargo, la naturaleza del 
mecanismo subyacente no afecta al hecho de que, desde el punto de vista del receptor, existe 
una asociación predecible entre la señal y el evento (shock, leopardo). En este sentido, una 
señal puede tener un origen afectivo o de expresión emocional por parte del emisor y, al mismo 
tiempo, tener un valor referencial si va asociada sistemáticamente a un evento externo. Sería 
erróneo clasificar de forma excluyente las señales como emocionales o referenciales, como 
pretendía el enfoque tradicional, porque ambas propiedades pueden darse al mismo tiempo. 
Una señal puede transmitir mayor o menor cantidad de información dependiendo de varios 
factores, que se describen a continuación. 

Cuan predictiva es. Es decir, cuan sistemática es su relación con el elemento del entorno. Por 
ejemplo, si la señal A es causada por la presencia de águilas, y raramente un águila aparece sin 
la señal A, entonces la señal A es altamente informativa de la presencia de un águila. En 
términos de condicionamiento pavloviano, la señal actúa como un estímulo condicionado, y el 
águila es el estímulo incondicionado. El valor informativo del estímulo condicionado descansa 
en el grado en que predice con exactitud la existencia del estímulo incondicionado. Para ser 
predictivo no es condición necesaria ni suficiente la mera contigúidad de ambos estímulos. En 
su lugar, la predicción depende de la diferencia entre la probabilidad de que se dé el estímulo 
incondicionado cuando está el estímulo condicionado menos la probabilidad de que se dé el 
estímulo incondicionado sin el estímulo condicionado. 

Cuan específica es. Es decir, cuan amplio o estrecho es el repertorio de estímulos asociados a 
la señal. Lógicamente, cuanto más reducido es el abanico de estímulos, más específica e 
informativa es la señal. Así, entre los suricates, pequeños mamíferos de las sabanas, existe una 
llamada vocal muy específica, que sólo se emite ante tres clases de aves, enemigos naturales 
suyos: las águilas marciales, las águilas rapaces y el azor lagartijero. Por el contrario, la señal 
ante mamíferos es menos específica. La emiten frente a un amplio repertorio de estímulos, que 
incluyen hienas, chacales, gatos salvajes, leones y perros. La información transmitida por una 
llamada de tipo «mamífero» es, por lo tanto, más vaga, menos precisa. 

Cuan intencional es. Este es un aspecto muy interesante y, a la vez, resbaladizo desde el 
punto de vista teórico, puesto que guarda relación con la intencionalidad que nosotros, los 
seres humanos, atribuimos a las señales comunicativas de los animales. Como destacan 
Seyfarth y Cheney (2003), las vocalizaciones pueden ser desencadenadas por una 
extraordinaria variedad de estímulos de todas clases: visuales, acústicos, olfativos, etc., pero 
hay una clase de estímulos que aparentemente no desempeña ningún papel en la comunicación 
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animal. Su ausencia es llamativa porque tales estímulos son precisamente los responsables de 
la mayor parte de las vocalizaciones en el lenguaje humano. ¿A qué clase de estímulos nos 
referimos? A los estados mentales que inferimos en los otros. Una función del lenguaje 
humano consiste en influir en la conducta de los demás cambiando lo que ellos saben, creen, 
desean, sienten, etc. Para dos seres humanos involucrados en una conversación, la percepción 
del estado mental del otro tiene un papel clave y es, probablemente, el tipo de estímulo que 
provoca la mayoría de las vocalizaciones. Cuando una persona habla con otra, le imputa 
estados mentales de alegría, abatimiento, ignorancia, etc., le atribuye deseos, conocimientos, 
intenciones, creencias, y considera que tales estados mentales pueden ser afectados por lo que 
escucha y, a su vez, que estos estados afectarán la conducta del oyente. Más en concreto, el 
hablante asume que la información que suministra va a alterar lo que el oyente conoce y que 
este cambio tendrá consecuencias deseables sobre su conducta. Es decir, el emisor tiene lo que 
se denomina una teoría de la mente sobre el receptor, teoría porque no es la percepción directa 
de un evento observable en el entorno; la única mente observable es la propia, por 
introspección; la del otro «la suponemos», la inferimos a partir de su comportamiento externo 
(Premack y Woodruff, 1978). Es precisamente la incapacidad de hacer esto lo que caracteriza 
a un grave trastorno de la personalidad como el autismo. 

Hay trabajos de observación y experimentales que han intentado comprobar si en algunos 
animales, particularmente primates no humanos, la hipotética percepción del estado mental de 
otro individuo puede constituir un estímulo capaz de provocar vocalizaciones. Hasta la fecha 
no se ha encontrado una evidencia clara de ello. Los monos vervet no intentan enseñar a los 
más jóvenes, ni modifican sus vocalizaciones en función del conocimiento o ignorancia de los 
receptores. Los macacos rhesus y japoneses no modifican sus llamadas en función del grado de 
información o ignorancia que sus crías tienen sobre la presencia de un depredador. Tampoco 
los chimpancés parecen ajustar sus vocalizaciones para informar a individuos ignorantes de su 
localización o de la localización de la comida. Es decir, en contraste con los seres humanos, 
parece que los primates (y los demás animales) no producen vocalizaciones en respuesta a su 
percepción de la ignorancia o la necesidad de información de otros individuos de la especie. 
Más allá de la comunicación vocal, los datos conductuales van en la misma línea: aunque los 
chimpancés tienen expresiones culturales y son capaces de utilizar herramientas (p. ej., palitos 
para Capturar termitas) no hay evidencia de que individuos expertos enseñen 
intencionadamente a otros inexpertos, o traten de modo distinto a los ignorantes y a los 
expertos (Tomasello y Cali, 1997). 


ENSEÑANZA DEL LENGUAJE HUMANO A LOS ANIMALES 

Como señalamos al principio, el lenguaje humano constituye una singularidad en el reino 
animal. No se trata de una trasnochada concepción antropocéntrica de la naturaleza. Los 
investigadores no han identificado aún ninguna forma de vida que posea un sistema de 
comunicación tan flexible y productivo como el nuestro, que reúna todas las características 
enunciadas por Hockett o siquiera las tres fundamentales seleccionadas de la lista: dualidad de 
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estructura, arbitrariedad simbólica y productividad sin límites. En palabras del filósofo y 
matemático Bertrand Russel, «no importa cuan elocuentemente pueda hablar un perro, no 
puede decirnos que sus padres eran pobres pero honrados». 
Prácticamente todos los seres humanos aprenden de forma espontánea durante la infancia una 
lengua y desarrollan todas las posibilidades del lenguaje sin apenas esfuerzo aparente. Dada su 
complejidad, el tiempo de aprendizaje es asombrosamente corto, ya que cualquier niño a los 
4-5 años tiene establecida en su mente la estructura básica del sistema lingúístico. 
Con la suficiente dedicación y paciencia, ¿sería posible enseñar a los animales un lenguaje 
comparable? Tal vez los animales tengan las posibilidades biológicas y cognitivas para 
desarrollar un lenguaje con una complejidad comparable al del ser humano, pero no han 
necesitado hacerlo para su supervivencia. O tal vez sea la nuestra la única especie zoológica 
con capacidad real para ello. 

+ Enseñanza a primates 
Lenguaje articulado 
Todas las tentativas de enseñar un lenguaje articulado a nuestros vecinos evolutivos 
(chimpancés, gorilas, orangutanes) terminaron en fracaso, hecho comprensible si se tiene en 
cuenta que el aparato bucofonador de los primates carece de las posibilidades articulatorias 
humanas. 
Desde el punto de vista anatómico, la posición de la laringe y la cavidad bucal son distintas en 
el chimpancé (u otros primates) y el Homo sapiens. Al adquirir la posición bípeda, la laringe 
humana descendió de su posición mamífera estándar, dejando por encima un conducto o tracto 
vocal más largo, con espacio suficiente para que la lengua pudiera adoptar las posiciones de 
los sonidos del habla. En la figura 2-4 se presentan, a la izquierda, imágenes de dos cortes 
sagitales, obtenidos por resonancia magnética, del tracto vocal de un chimpancé (Fig. 2-4 A) y 
de un ser humano (Fig. 2-4 B). 


Junto a ellas se muestran dos 
dibujos esquemáticos de sus 
respectivos  tractos. Es 
evidente que la laringe 
humana ocupa una posición 
más baja en la garganta que la 
del chimpancé. En la mayoría 
de los mamíferos la laringe 
está tan alta que se comunica 
directamente con la cavidad 
nasal y permite la respiración 

y la deglución simultánea de 
guralacal Under de resonancia cagao fiulerda) pesen (derechal det earernccitasuntilne». Alimentos, lo que no es posible 
lo e a oa en los seres humanos adultos 
A sin  atragantarse. Por el 
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contrario, la mayor cavidad dejada por el descenso laríngeo permite un rango mayor de soni- 
dos, hecho que, en opinión de algunos autores (Fitch, 2000), fue un factor determinante para la 
aparición y evolución del lenguaje articulado. 

Los bebés humanos nacen con la laringe en una posición alta (vértebras cervicales 1 a 3), 
semejante a la de los chimpancés adultos. Su lengua es grande en comparación con su cavidad 
oral reducida, con la única posibilidad de movimiento en el eje anterior-posterior, razón por la 
cual los sonidos durante los primeros meses tienden a ser escasos y nasalizados. Un bebé sí 
puede deglutir alimentos -durante el amamantamiento- y respirar al mismo tiempo. Más 
adelante, entre los 3 meses y los 3 años de edad, la laringe humana desciende hasta el nivel de 
las vértebras cervicales 3 a 5 y la cavidad oral se alarga, permitiendo que la lengua adopte 
distintas posturas en el eje vertical. De esta manera, el tracto vocal humano permite articular 
sonidos que el aparato fonoarticulatorio de un primate no puede generar, como las vocales 
extremas, a, i, u y otras intermedias. En realidad, estas diferencias anatómicas eran conocidas 
desde el siglo XIX, pero su significación acústica no se reconoció hasta la década de 1960. 

El primer intento documentado de enseñar a hablar a un chimpancé se debió a los esposos 
Kellogg, quienes durante los años treinta criaron una chimpancé hembra (Gua) junto con su 
propio hijo (Kellogg y Kellogg, 1933). Gua nunca llegó a articular una palabra reconocible, y 
sólo parecía entender unas pocas. Veinte años después, Cathy y Keith Hayes criaron otra 
chimpancé, llamada Viki (Hayes, 1951). Después de 6 años, sólo lograron que Viki articulara 
penosamente cuatro palabras: «mama», «papa», «up» (arriba) y «cup» (taza). Pronto quedó 
claro que, debido a las diferencias anatómicas señaladas, la idea de enseñar lenguaje articulado 
a un primate estaría condenada al fracaso o a resultados muy pobres. 

Ahora bien, la esencia del lenguaje humano no es tanto su materialización sonora como la 
compleja estructura sintáctica y semántica que subyace bajo los sonidos; de hecho, el lenguaje 
de los signos en las personas sordas tiene una complejidad similar a la del lenguaje oral. Tal 
vez las dificultades observadas sólo eran producto de la elección de una interface inadecuada. 
Como los chimpancés tienen facilidad para imitar gestos y buena destreza manual, los 
siguientes ensayos se orientarían principalmente en dos nuevos caminos: lenguajes gestuales 
(lenguas para personas sordas) y el manejo de símbolos gráficos. 


Lenguaje gestual 
E pe ES En los años setenta del pasado siglo, Alien y Beatrix Gardner, 
a Y q. esposos y profesores de la Universidad de Nevada, sometieron a 
| una chimpancé hembra (Washoe) de 8 meses de edad a un 
entrenamiento intensivo en el Ameslan, o American Sign 
Language (ASL), el lenguaje de signos para personas sordas (Fig. 
2-5). 
€ , A la edad de 4 años, Washoe podía realizar mediante gestos 85 
Dicc ana a signos y comprender bastantes más. Con el tiempo, Washoe 
aumentó su vocabulario hasta producir unas 150 palabras (Gardner 
y Gardner, 1969). Su vocabulario comprendía palabras de distintas categorías sintácticas: 
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nombres, verbos, adjetivos, adverbios, pronombres y partículas negativas. Algunos ejemplos 
son: «perro», «gato», «sombrero», «llave», «puerta», «flores», «dulce», «alegre», «comer», 
«abrir», «salir», «limpiar», «beber», «oler», «más», «deprisa», «arriba», y otras. En una fase 
ya tardía adquirió el uso de los pronombres // me y you. 

Según los esposos Gardner, cuando sólo conocía una decena de signos, Washoe formaba 
espontáneamente cadenas de dos o más palabras; por ejemplo, «puerta abrir rápido», sin que el 
orden importara, mientras intentaba abrir una puerta cerrada. En los informes sobre sus 
progresos se documenta la aparición de errores por sobregeneralización del significado, al 
igual que sucede en los niños pequeños. Por ejemplo, el signo «flores» lo aplicaba también a 
objetos con olor floral, o el signo «herida/herir» lo extendía a tatuajes, manchas rojas sobre la 
piel o cortes en un vestido. Se informaba de que Washoe era capaz de crear signos nuevos. Por 
ejemplo, cuando vio por primera vez un pato, utilizó la combinación de dos signos que ya 
conocía: «agua pájaro». 

En definitiva, Washoe constituyó uno de los casos más impresionantes de aprendizaje animal 
de un sistema de comunicación humano, utilizando símbolos arbitrarios asociados a 
significados. Esta chimpancé llegó a producir cadenas de hasta cinco signos, pero, por otra 
parte, era poco sensible al orden de las palabras. 

Una línea de investigación interesante es si un chimpancé que ha aprendido un lenguaje nuevo, 
lo transmitirá a sus descendientes. Curiosamente, Loulis, un hijo adoptivo de Washoe, 
empleaba sin intervención humana algunos de los signos aprendidos por Washoe y otros chim- 
pancés de su entorno. 

En la década de 1980 se llevaron a cabo nuevos intentos con otros monos, con resultados 
diversos: el chimpancé Nim, la gorila Koko y el orangután Chantek. Terrace, Petitto, Sanders 
y Bever (1979) describen los progresos de Nim Chimpsky con el ASL. Nim aprendió unos 125 
signos gestuales y fue capaz de usar combinaciones de dos signos con cierta regularidad. Por 
ejemplo, el signo que indicaba lugar aparecía en segundo lugar tras el signo del objeto. Pero 
esta regularidad se perdía cuando las cadenas eran más largas. Al contrario que los niños, Nim 
raramente usaba los signos de forma espontánea y la mayor parte de su producción era en 
respuesta a sus entrenadores. 

Símbolos gráficos 

El lenguaje de los signos es un medio adecuado de interacción con los antropoides, pero 
plantea algunas dificultades en su control experimental. Dada su rapidez y la ambigiúedad de 
algunas respuestas, no siempre está claro si el mono ha ejecutado un gesto determinado de 
manera inequívoca. Por este motivo, David Premack eligió una aproximación distinta con la 
chimpancé Sara (Premack, 1986). El prima-ólogo de la Universidad de Santa Bárbara recurrió 
al uso de pequeñas fichas de plástico de distintas formas, tamaños y colores (Fig. 2-6). 
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Nombres 


Sara Mary Cubo Plato 


Chocolate Manzana Plátano Albaricoque Uva 


Verbos 
Es Dar Tomar Insertar Lavar 


Conceptos/condicionales 


Igual Diferente No 


A 


Nombre de Color de ? Si... entonces 


Dd Y 


Rojo Amarillo Marrón Verde 


Adjetivos (colores) 


Figura 2-6. Simbolos gráficos utilizados por David Premack para entrenar a la chimpancé Sara. 


Al contrario que Washoe y otros monos que fueron criados por los propios investigadores, 
Sara estaba confinada en su jaula del laboratorio y fue sometida a un cuidadoso y detallado 
programa de investigación. Cada ficha representaba una «palabra» y, gracias a un pequeño 
imán, podían colocarse sobre una pizarra magnética. Premack estableció una secuencia de 
pasos para enseñar a Sara un lenguaje a través del manejo de estas fichas. 

Los símbolos podían ordenarse verticalmen-te sobre la pizarra de acuerdo con determinadas 
reglas. El conjunto de los símbolos y sus reglas constituían todo un lenguaje: el premackense. 
Sara adquirió un vocabulario de unos 60 nombres, 20 verbos y otras 20 palabras que incluían 
adjetivos y adverbios. La chimpancé tenía que formar «oraciones» sencillas escogiendo las 
fichas adecuadas de entre un conjunto y colocándolas verticalmente sobre la pizarra en el 
orden correcto. 

Una ventaja de este sistema es que requiere menos carga de memoria y el resultado está 
siempre a la vista (del mono y del investigador). Premack enseñaba a Sara a través de un 
procedimiento sistemático de sustitución de fichas. Por ejemplo, la «oración» en premackense 
«Randy da manzana a Sara» servía de base para la oración «Randy da banana a Sara» y otras 
similares. A través de técnicas de condicionamiento, Premack demostró que Sara podía 
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distinguir entre «Randy da manzana a Sara» y «Sara da manzana a Randy», o generar 
combinaciones relativamente complejas con el empleo de condicionales «si... entonces...». Sin 
embargo, a pesar de estos logros, no hay una evidencia clara de que, más allá de un mero 
condicionamiento, Sara hubiera interiorizado y manejara verdaderas reglas sintácticas. De 
acuerdo con Herbert Terrace, el nivel sintáctico de producción de los chimpancés, tanto por 
vía gestual como con formas visuales, no superaría el estadio de una gramática de dos 
palabras, propia de un niño de 18 meses. 

Uno de los proyectos más ambiciosos en la enseñanza de un lenguaje a antropoides fue el 
emprendido por el equipo de Atlanta liderado por Duane Rumbaugh y Sue Savage-Rumbaugh. 
Aprovechando las posibilidades de los ordenadores, crearon un lenguaje -bautizado con el 
nombre de yerkish, en honor del centro de primates Yerkes- formado por un centenar de 
lexigramas o figuras abstractas colocadas sobre el teclado del ordenador. A cada lexigrama le 
correspondía una acción concreta, un objeto o un calificativo. El mono seleccionaba sobre el 
teclado, o sobre una cartulina, los lexigramas adecuados en interacción con los 
experimentadores para obtener un refuerzo (comida, juego, salida, etc.). Uno de los logros más 
llamativos fue en la exploración de las capacidades de abstracción y categorización de tres 
chimpancés: Lana, Sherman y Austin (véase la revisión de Vauclair, 2003 ). En un principio, 
aprendieron a asociar los lexigramas con distintos objetos, algunos de los cuales eran 
alimentos, y otros, herramientas, como destornillador, martillo, tenazas, etc. En una segunda 
fase, los chimpancés consiguieron aprender lexigramas que representaban a la categoría 
completa, es decir, un único lexigrama para toda la clase de los «alimentos» y otro para la clase 
de las «herramientas». De esta manera, los animales manejaban símbolos que representaban 
categorías abstractas o conceptos. 

Los resultados más extraordinarios de este equipo se obtuvieron con un bonobo, llamado 
Kanzi, frecuentemente citado en la literatura científica. El bonobo es una especie de 
chimpancé más pequeño (Pan paniscus) que, a tenor de estudios comparativos, probablemente 
es más inteligente, tiene una vida social más rica y un repertorio comunicativo más amplio que 
el chimpancé común (Pan troglodytes). Según los informes de Savage-Rumbaugh y sus 
colegas (p. ej., Savage-Rumbaugh y Lewin, 1994), Kanzi comenzó a aprender los lexigramas 
simplemente por observación, asistiendo a las sesiones en las que se adiestraba -sin éxito- a su 
madre. Al contrario que los chimpancés comunes, este bonobo parecía no necesitar refuerzos 
externos ni un entrenamiento intensivo. Bastaba un simple «diálogo» con los entrenadores, 
quienes activaban el lexigrama apropiado con el teclado del ordenador de Kanzi, mientras 
pronunciaban la palabra asociada. 

Toda la actividad, tanto de Kanzi como de sus entrenadores, era registrada y almacenada por el 
ordenador, por lo que se conservó un rico corpus de datos muy superior al de cualquier otro 
proyecto anterior. El equipo de Savage-Rumbaugh acumuló un total de más de 13.000 
emisiones a lo largo de un período de 4 meses. De ellas, 1.400 eran combinaciones de dos o 
más lexigramas, que se sometieron a un minucioso análisis en busca de algún rudimento de 
sintaxis. Por otra parte, Kanzi alcanzó niveles sorprendentes en la comprensión del inglés. A la 
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edad de 6 años entendía unas 400 palabras, y su comprensión iba más allá de las palabras 
aisladas. 
Parece que Kanzi era sensible a cierto orden en las combinaciones léxicas y distinguía entre 
«pon algo de leche en el agua» y «pon algo de agua en la leche» o «pon el sombrero sobre la 
pelota» y «pon la pelota sobre el sombrero». También respondía correctamente a instrucciones 
más complejas, como «buscar la pelota que está debajo de la mesa del jardín». Kanzi se dirigía 
directamente a esa pelota, pasando por alto otras del jardín. Su comprensión del inglés fue 
evaluada junto con la de una niña (Alia) de 2 años, a través de centenares de frases. Gran parte 
de los ensayos fueron ciegos, en los que los sujetos (Kanzi o Alia) no podían ver al 
experimentador. Los resultados finales arrojaron un 74% de oraciones correctamente 
comprendidas por Kanzi, frente a un 65% por Alia. 

+ Enseñanza de un lenguaje a los animales: consideraciones generales 
No sólo se ha intentado enseñar el lenguaje a los primates; algunos investigadores lo han 
intentado con especies como los delfines, los loros o los perros, como se describe en el 
recuadro 2-3. 


Recuadro 2-3. Enseñanza a otras especies animales 


Delfines 

Los delfines tienen notables capacidades en algunas áreas cognitivas y son animales a los que 
también se les ha intentado enseñar lenguajes artificiales. Uno de los trabajos más citados es 
el dirigido por Louis Hermán y sus colegas de Hawai durante los años ochenta con dos 
delfines hembras, llamadas Akeakamaiy Phoenix, de la especie más popular de cuello de 
botella, o delfín mular (Hermán, Richards y Wolz, 1984). 

Akeakamoi, o Ake, fue entrenada en un lenguaje basado en gestos de los brazos y las piernas 
del entrenador; Phoenix fue entrenada en un lenguaje acústico basado en sonidos de tipo clic 
sintetizados por ordenador y transmitidos mediante altavoces subacuáticos. Cada lenguaje 
contenía un vocabulario de unas 35 a 40 «palabras», la mayoría de ellas comunes a ambos 
sistemas. Las palabras se referían a objetos de la piscina, como «pelota», «aro», «tubo», 
«Canal», «puerta», «persona», «altavoz»; a acciones que ellos podían ejecutar, como «ir», 
«pasar por debajo», «poner encima», «sacar», «tocar-cola» (tocar con la cola), y 
modificadores de localización («fondo», «superficie») y dirección («derecha», «izquierda»). 
Además, los lenguajes contenían palabras de función y control, como «sí», «no», «borrar» 
(para ignorar las palabras previas de una frase) y de interrogación (una señal para preguntar 
sobre la presencia o ausencia de un objeto en la piscina). Las ejecuciones correctas eran 
recompensadas con pescado. 

Se entrenó a ambos delfines en dos tipos de oraciones: no relaciónales y relaciónales. Con las 
primeras, el delfín debía interaccionar sólo con un objeto. Su sintaxis, idéntica para ambos 
lenguajes, consistía en modificador (opcional) + objeto + acción. Por ejemplo, ante «derecha» 
+ «tubo» + «tocar-cola», el delfín debía tocar con su cola el tubo de la derecha. Las segundas 
implicaban que el animal moviera un objeto hacia otro. La sintaxis era: objeto 1 + relación + 
objeto 2, para Phoenix, y objeto 1 + objeto 2 + relación, para Ake. Por lo tanto, estas 
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instrucciones requerían que los animales atendieran a la posición de los dos objetos en la 
cadena de palabras. En general, parece que las capacidades de los delfines son comparables a 
las de los chimpancés (pensemos, por ejemplo, en Sarah y sus símbolos magnéticos). Al igual 
que los monos, no tienden a iniciar espontáneamente una conversación. 

Loros 

Los loros y otras aves afines pueden imitar el habla humana, algo poco frecuente en el mundo 
animal. La investigadora Irene Pepperberg se planteó la posibilidad de ir más allá con su loro 
gris africano (Psittacus erithaeus), llamado Alex, y lo sometió a un programa intensivo para 
que fuera capaz de producir y comprender docenas de palabras del inglés (véase en castellano 
Pepperberg, 1999). 

Pepperberg empleó un método denominado modelo-rival en el que Alex tenía que competir 
con rivales humanos para atraer la atención del entrenador. En una situación típica, un entre- 
nador A pide que otro entrenador B pronuncie el nombre de un objeto (p. ej., «pasta»); cuando 
B lo hace, entonces A pide a Alex que haga lo mismo. De forma periódica, A y B 
intercambian sus papeles y en todos los casos el loro es animado a participar en el juego. En 
estas situaciones el refuerzo es intrínseco: en lugar de obtener comida u otro refuerzo externo, 
Alex recibe el objeto nombrado en respuesta a su producción correcta. Si Alex prefiere un 
objeto distinto, antes debe articular correctamente su nombre. Como cabría esperar, al 
principio el loro no pronuncia bien las palabras de objetos nuevos, pero los entrenadores 
moldean gradualmente su producción por aproximaciones sucesivas. 

Después de 13 años, Alex tenía un vocabulario de 80 palabras, que incluían nombres de 
objetos (p. ej., «piedra», «papel», «bandeja»), colores («verde», «azul», «gris»), formas 
(triángulo = «tres esquinas»; cuadrado = «cuatro esquinas»), números («dos», «tres», 
«Cuatro», «cinco» y «seis»), frases verbales («ven aquí», «quiero ir a X», siendo X un lugar), 
y el uso funcional de «sí» y «no». Además, podía producir y entender secuencias cortas de 
palabras. Cuando Alex deseaba saber cómo se llamaba un objeto preguntaba «¿qué es esto?», 
o por un color, «¿qué color?». 

Hay que decir que el propósito primordial de Pepperberg al enseñar a Alex palabras y frases 
del inglés no era tanto evaluar sus capacidades lingúísticas como sus capacidades cognitivas. 
Sorprendentemente, Alex era capaz de clasificar hasta 40 objetos en función de su color o sus- 
tancia, contar hasta seis, comprender los conceptos de igual/distinto o el concepto de 
ausencia. Parece que estas aves muestran ciertas habilidades cognitivas capaces de rivalizar 
con primates y delfines. 

Perros 

El perro doméstico es, en cierto sentido, un animal especial dada su coevolución con la 
especie humana a lo largo de generaciones. También es sabido que los perros pueden aprender 
a responder a un gran número de palabras. Recientemente se ha dado noticia en Science de las 
habilidades de Rico, un bordercollie entrenado en el Instituto Max Planck de Leipzig, que es 
Capaz de entender unas 200 palabras distintas (Kaminski, Cali y Fischer, 2004). Uno de los 
investigadores participantes, el primatólogo catalán Josep Cali, resumía en una entrevista (El 
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País, 15-03-2006) las habilidades de Rico: 

Entrevistados En Alemania usted ha trabajado con un perro que conocía 200 palabras. 

Josep Cali. Cuando lo conocimos sabía unas 200 palabras y ahora debe estar por las 300. Pero, 
lo más interesante es cómo aprende. El perro tiene unos 200 juguetes diferentes, le pones 10 
en una habitación sin que los vea y le dices: «Tráeme la pelota». El animal va a la habitación, 
mira los objetos que hay y vuelve con la pelota. Ahora, le pones siete objetos que conoce y 
uno que no ha visto nunca. Le pides el nuevo: «la taza». Se va a la habitación, los mira todos y, 
por eliminación, vuelve con la taza. Lo más increíble es que cuando se colocan en la 
habitación sólo objetos nuevos que ha aprendido de esta forma y le pedimos otra vez: «la 
taza». La vuelve a traer, y ya no por eliminación. 

P. ¿Cómo aprende de forma tan rápida? 

J,C. Este perro es un bordercollie y, cuando publicamos el estudio, recibimos un montón de 
correspondencia de gente que nos decía que tenía uno y hacía lo mismo. Cuando preguntamos 
a los dueños cómo empezaron a entrenarlos, lo que nos contestaron es que fueron los perros 
los que comenzaron. Esto quiere decir que están tremendamente motivados para este juego. 
Para hacer un paralelismo con seres humanos, los niños pequeños también están 
extremadamente motivados para jugar a indicar o comentar cosas. Y esta motivación de los 
niños para ciertos juegos es clave para describir las diferencias entre los humanos y nuestros 
primos más cercanos, los grandes simios. 


¿Y qué podemos concluir a la luz de los datos disponibles? De las muchas capacidades que 
parecen separarnos del resto de los animales, ninguna se presenta tan crucial y determinante 
como el lenguaje, hasta el punto de que su sorprendente singularidad constituye un desafío 
intelectual en el marco de la evolución filogenética. Como se ha señalado, es posible hallar 
semejanzas entre muchas especies animales y los seres humanos en relación con la 
organización cerebral o con ciertas capacidades cognitivas. De hecho, existen importantes 
paralelismos entre las capacidades cognitivas de un chimpancé, nuestro pariente más próximo, 
y las que exhibe un niño de 1 -2 años de edad. Por el contrario, este paralelismo se rompe 
totalmente si se comparan las capacidades lingilísticas de ambos. 

Los diversos esfuerzos realizados para enseñar a los animales nuestro lenguaje natural o un 
lenguaje artificial de cierta complejidad, han dado lugar a resultados desiguales, algunos de 
ellos asombrosos. El lenguaje humano es complejo y abarca diversos componentes en distintos 
niveles de organización (sonidos, elementos léxico-simbólicos, sintaxis, etc.). A la hora de 
plantear consideraciones generales sobre la enseñanza del lenguaje a los animales convendría 
abordar algunos de estos aspectos por separado. 

Manejo de símbolos y significados 

Las situaciones de comunicación que los investigadores han generado con primates cautivos y 
otras especies que presentan importantes destrezas comunicativas (delfines, loros) nos revelan 
que estos animales pueden aprender a utilizar sustitutos -símbolos abstractos o gestos- en lugar 
de objetos, acciones o propiedades. Esto demuestra una innegable capacidad representacional. 
Tanto los gestos en Washoe y el delfín Ake, como las figuras abstractas en Sarah o los 
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lexigramas en Kanzi, los clics en el delfín Phoenix o las palabras inglesas en el loro Alex 
indican que los animales pueden asociar símbolos arbitrarios con objetos con los que no 
guardan una relación de semejanza física. No obstante, la capacidad de producción siempre ha 
estado muy por detrás de la comprensión. 

¿Esta asociación entre un símbolo y un objeto es del mismo tipo que la que existe en el 
lenguaje humano, aunque sea en menor escala? Es difícil contestar a esa pregunta. Siguiendo 
el razonamiento de Harley (2009), desde hace tiempo sabemos que los animales pueden ser 
entrenados en la discriminación entre palabras distintas, tanto orales como escritas. Se puede 
enseñar a las palomas a responder de forma diferencial a dibujos de árboles y de agua. Dando 
un paso más allá, es fácil imaginar que, por condicionamiento, las palomas pueden aprender a 
dar respuestas distintas a una palabra escrita (p. ej., picoteando una vez) frente a otra palabra 
(p. ej., picoteando dos veces), y así sucesivamente. ¿Podríamos decir que las palomas están 
aprendiendo a «nombrar» las palabras? o ¿en qué medida esta conducta de «nombrado» es 
distinta de la nuestra? Una diferencia obvia es que nosotros manejamos los significados de 
esas palabras y tenemos una representación mental organizada de ellos. Sabemos que los 
árboles tienen hojas y raíces y, por lo tanto, sabemos que la palabra «árbol» guarda una 
relación determinada con la palabra «hoja». Conocemos la relación conceptual que hay entre 
ellas. Si presentamos la palabra escrita 'tree' (árbol) a una paloma que ha aprendido a 
«nombrarla» en inglés y luego observamos sus respuestas ante otras palabras, probablemente 
su conducta de picoteo nos revelará que para ella la palabra 'tree' está más relacionada con la 
palabra 'trek' (caminata) que con "leaf (hoja). 

Sin embargo, como hemos visto, los chimpancés y otros animales pueden asociar símbolos 
con objetos; ¿su uso se parece más al de las palomas o al de los seres humanos? De acuerdo 
con Harley (2009), una pregunta más concreta que podríamos hacernos es: ¿esta asociación 
permanece constante a través de contextos distintos? Para un ser humano una «fresa» es una 
fresa en situaciones muy distintas: sobre una mesa, en un bol con nata, en su mata en el campo 
aunque esté semienterrada en el suelo, etc. No está claro que esto sea así para un chimpancé. 
Por ejemplo, Nim podía señalar correctamente los símbolos de «manzana» o «banana» si los 
objetos eran presentados de uno en uno, pero no era capaz de hacerlo cuando se le mostraban 
las dos frutas a la vez. 

Sintaxis 

Acaso tropecemos aquí con el principal talón de Aquiles de las capacidades lingúísticas en los 
animales no humanos. Hemos visto las posibilidades que tienen los chimpancés, los delfines o 
los loros en cuanto al manejo de símbolos dotados de significados. Sin embargo, hay poca 
evidencia de que los mismos individuos puedan combinar símbolos en secuencias 
significativas a modo de oraciones. Los primates entrenados en cautividad pueden conseguir 
resultados admirables. Kanzi, por ejemplo, es capaz de interpretar frases que no ha oído nunca, 
como «ve al despacho y trae la pelota roja», entendiéndolas más o menos como lo haría un 
niño de 2 años y medio de edad. Ambos entienden oraciones de este tipo, pero ninguno es 
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capaz de construirlas. Sin embargo, un año después de haber practicado con ellas, el niño 
empieza a componer por su cuenta oraciones nuevas, mientras que el mono se detiene ahí. 
Kako (1999) hizo un repaso de las habilidades sintácticas demostradas por tres de los casos 
más sobresalientes: el loro Alex, los delfines de Hermán y el bonobo Kanzi. De los distintos 
elementos que intervienen en la sintaxis del lenguaje, el autor señala la dificultad que estos 
animales presentan en la adquisición de palabras de clase cerrada, o funcionales, que serían 
esenciales para elaborar una estructura sintáctica. Se trata de los artículos o determinantes, 
preposiciones, conjunciones, sufijos gramaticales, etc., que no tienen un significado pleno 
como las palabras de clase abierta (nombres, verbos, adjetivos), pero desempeñan un papel 
clave en la construcción del andamiaje sintáctico que asigna papeles de sujeto, objeto directo, 
objeto indirecto, etc., a las partes de una oración. Son precisamente estas palabras las que más 
dificultad encierran para las personas sordas. Según Kako, sería primordial enseñar y diseñar 
experimentos sobre distinciones entre, por ejemplo, put irí (poner en) y put on (poner sobre), o 
entre plural y singular («da pelota a Randi» frente a «da pelotas a Randi»). En este sentido, el 
autor no se muestra especialmente optimista sobre las capacidades morfosintácticas de los 
animales. 

Capacidad de hacer planes 

Para Calvin (2004) y otros autores, sería la capacidad de hacer planes y otras habilidades 
cognitivas las que habrían contribuido de forma decisiva a que el lenguaje se desarrollara en 
los seres humanos del modo en que lo ha hecho. Gran parte de lo que se comunica 
lingúísticamente se refiere a objetos o situaciones que están más allá del aquí y ahora 
inmediato. Al mismo tiempo, la interdependencia entre el lenguaje y esta propiedad de la 
inteligencia humana sería en un doble sentido. Calvin considera que para idear soluciones ante 
una situación del entorno hay que imaginarse múltiples planteamientos, y la capacidad 
humana de hacer planes quizá se derive del uso del lenguaje, es decir, de nuestra destreza para 
construir estructuras conceptuales largas mediante nexos sintácticos. 

Los animales dan escasas muestras de ser capaces de hacer planes futuros, para más allá de 
unos pocos minutos. Por ejemplo, los chimpancés de algunas áreas geográficas utilizan largas 
varitas que introducen en los termiteros para sacar termitas. Se trata de una manifestación 
cultural compartida por las comunidades de ciertos enclaves africanos. Pero nunca se ha 
observado, en condiciones naturales, que un individuo prepare varios palitos para su uso fu- 
turo, en previsión de su escasez en otro entorno. 
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RESUMEN 


El número de lenguas que han existido en el mundo a lo largo de los años ha sido muy 
amplio, muchas han desaparecido, pero se calcula que actualmente aún quedan algo 
más de 6.000. Y aunque muy diferentes entre sí, todas comparten una gran complejidad 
gramatical. 

No existen lenguas primitivas y avanzadas, simplemente hay lenguas diferentes que se 
pueden agrupar por familias. 

El lenguaje que utilizamos los seres humanos constituye el mayor logro conseguido por 
nuestra especie y lo que más nos diferencia de los demás animales. El hecho de que con 
unos pocos sonidos podamos producir un número infinito de mensajes nos abre unas 
posibilidades infinitas de comunicación y, sin duda, ha permitido nuestra evolución 
cultural. 

Los animales tienen sistemas de comunicación, en algunos casos muy eficientes, pero 
ninguno se parece al lenguaje humano. Además, ninguna especie animal está dotada 
para adquirir el lenguaje humano. Aunque hubo numerosos intentos de enseñar nuestro 
lenguaje a diferentes especies animales, en particular a los primates, los logros son más 
bien escasos, sobre todo en lo que se refiere a la sintaxis, uno de los componentes 
fundamentales de nuestro lenguaje. 


PREGUNTAS DE REFLEXIÓN: 


¿Cuáles son las características más distintivas del lenguaje humano? 

¿En qué consiste la recursividad del lenguaje humano? 

¿Qué tipo de palabras les resultan más difíciles de aprender a los primates? ¿Por qué? 
¿Cuáles son las dos familias lingiísticas más habladas en el mundo? 
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Objetivos de aprendizaje 
Al finalizar el capítulo el alumno será capaz de: 
e Comprender el papel de la genética y del ambiente en el desarrollo del lenguaje. 
e Tener una visión crítica sobre la existencia de períodos críticos en el desarrollo del 
lenguaje. 
e Conocer las áreas cerebrales responsables del lenguaje. 
e Tener una visión crítica del modelo Wernicke-Geschwind. 
e Entender la asimetría hemisférica que existe en relación al lenguaje. 
e Conocer las principales metodologías neurofisiológicas de investigación. 


INTRODUCCIÓN 

En este capítulo se comprobará que el lenguaje humano está doblemente entroncado en la 
naturaleza. En primer lugar, se abordarán varios argumentos que sugieren que el lenguaje 
humano tiene un origen biológico o innato; el provocativo título del libro de Stephen Pinker, 
El instinto del lenguaje, expresa perfectamente esta idea. Varios hechos apoyan la hipótesis, 
biologicista del lenguaje; por ejemplo, la adquisición temprana del lenguaje, a pesar de la 
estimulación un tanto caótica (pobreza del estímulo), y posible la existencia de un período 
crítico de desarrollo favorecen la idea de rasgo instintivo más que de aprendizaje social. 
Veremos incluso cómo la moderna genética molecular está intentando descubrir los «genes 
del lenguaje». 

En segundo lugar se describirá cómo el lenguaje es un producto del cerebro; la moderna 
neurociencia aporta evidencias incontestables sobre las bases cerebrales del lenguaje, pero 
también nos revela lo insuficiente de nuestro conocimiento en este campo. No siempre es- 
tuvo claro que la mente residiera en el cerebro. Aristóteles, por ejemplo, creía que un órgano 
tan inmóvil, grasiento, aparentemente inútil y escaso de sangre (en cadáveres), no podría 
desempeñar un papel importante en el cuerpo humano. Para el filósofo griego, el cerebro era 
una flema que serviría únicamente para refrigerar la sangre, una especie de radiador. 
Consideraba más lógico atribuir al corazón el centro de la vida emocional y mental: ocupa 
una posición central en el cuerpo, se mueve, contiene sangre y, cuando se detiene, cesa la 
vida y toda actividad anímica. Esta posición cambió radicalmente a medida que avanzó el 
conocimiento sobre la función y estructura cerebral gracias a los estudios post mortem y la 
observación de los efectos de las lesiones. Hoy, las modernas técnicas de neuroimagen 
permiten estudiar cerebros sanos mientras realizan una función y registrar las áreas más 
activas durante su ejecución. 

Una disciplina que ha aportado gran información sobre las bases neurológicas del lenguaje 
ha sido la neuropsicología, a partir de estudios con pacientes que han perdido parte de sus 
funciones cognitivas como consecuencia de una lesión cerebral. En esta línea, la 
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neuropsicología del lenguaje, o neurolingúística, intenta encontrar relaciones entre las 
actividades lingiísticas y las áreas cerebrales. 

A la hora de localizar partes del cerebro que pudieran estar asociadas a funciones específicas, 
es particularmente interesante el descubrimiento de las denominadas disociaciones dobles, 
como se verá en el capítulo 12. Consideremos dos pacientes, 1 y 2, con lesiones diferentes: el 
paciente 1 realiza normalmente una determinada función o tarea cognitiva (A), mientras que 
no puede ejecutar otra tarea distinta (B); el paciente 2 muestra el patrón opuesto, es decir, 
ejecuta normalmente la tarea B pero es incapaz de llevar a cabo la tarea A o lo hace muy 
pobremente. Esta pauta de disfunciones opuestas en individuos con lesiones distintas se 
considera una disociación doble, y la interpretación tradicional es que ambas tareas 
corresponden a procesos independientes asentados sobre estructuras neurales distintas. En la 
realidad se dan casos, por ejemplo, de pacientes que son incapaces de leer seudopalabras, o 
«palabras» pronunciables que no existen en su idioma (p. ej., «nizome»), pero no tienen 
problemas para leer palabras reales de uso frecuente (p. ej., «hombre»), mientras que otros 
pacientes muestran el patrón opuesto: leen las seudopalabras pero tienen serias dificultades 
con las palabras. Esto sucede de forma más nítida en lenguas como el inglés, de ortografía 
menos transparente que el castellano. Por otra parte, como se verá más adelante, la afasia de 
Broca y la afasia de Wernicke presentan, en cierto modo, patrones de síntomas 
complementarios. 

No obstante, al hablar de lesiones cerebrales, hay que evitar caer en una visión 
excesivamente localizacionista. No hay que olvidar que el daño cerebral puede afectar tanto 
a la sustancia gris como a la sustancia blanca (fibras de conexión). Una disfunción o 
trastorno podría aparecer como consecuencia no tanto del deterioro de una estructura local, 
sino de la desconexión entre áreas distantes entre sí. 


NATURALEZA BIOLÓGICA DEL LENGUAJE HUMANO 
e Argumentos favorables 

Hay una serie de datos que sugieren que el lenguaje es un rasgo biológico específico de 
nuestra especie, y que es más un instinto que una invención cultural (de. Vega y Cuetos, 
1999). A favor de esta concepción biologicista del lenguaje humano existen varios 
argumentos importantes, que se abordan a continuación. 
Adquisición espontáneo y temprano 
Para aprender a hablar no hace falta ir a la escuela. Únicamente se necesita exposición 
lingúística a una edad temprana, es decir, estar inmerso dentro de una comunidad que hable 
una lengua. Lo sorprendente de este hecho lo describió humorísticamente Nicolás Fernández 
de Moratín ya en el siglo XVIII: 

Admiróse un portugués 

de ver que en su tierna infancia 
todos los niños en Francia 
supiesen hablar francés. 
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«Arte diabólica es», 
dijo, torciendo el mostacho, 
«que para hablar en gabacho 
un fidalgo en Portugal 
llega a viejo y lo habla mal; 
y aquí lo parla un muchacho». 
Pese al tono burlesco del autor de estos versos, está claro que el portugués de la fábula puso 
el dedo en la llaga en lo que andando el tiempo sería un problema científico de primera 
magnitud. La escritura sí es una invención cultural y requiere instrucción sistematizada para 
su transmisión, pero la adquisición del lenguaje hablado ocurre de forma espontánea y en un 
plazo relativamente corto de tiempo, al igual que otras conductas biológicas. 
Cuando una función cognitiva surge de forma temprana, y de acuerdo con una secuencia de 
desarrollo relativamente uniforme en los niños de todas las culturas, es muy probable que se 
trate de una capacidad innata (de Vega y Cuetos, 1999). Algunos niños aprenden el lenguaje 
más rápidamente que otros. Por ejemplo, a la edad de 24 meses, hay niños o niñas que sólo 
dicen un puñado de palabras, mientras que otros ya pronuncian 300 (Fenson et al., 1994). Sin 
embargo, más allá de esas diferencias de ritmo, las pautas y etapas de adquisición son 
notablemente similares en todos ellos. 
A los 4-5 años de edad el niño ha desarrollado el núcleo esencial de la competencia 
lingúística. Le falta ampliar el vocabulario, corregir errores, manejar estructuras Cada vez 
más complicadas, etc., pero dispone ya de la habilidad de comprender y generar miles de 
oraciones en contextos cambiantes y según un sistema gramatical complejo. Su competencia 
y flexibilidad lingúísticas están muy por encima de lo que, hoy por hoy, podría hacer el 
ordenador más potente del mundo. Según algunos cálculos, si el niño no contara con una 
predisposición inicial para el lenguaje y tuviera que adquirir un sistema tan intrincado desde 
cero, por mero aprendizaje, necesitaría decenas de años, por no hablar de siglos. 
Pobreza del estimulo 
Uno de los argumentos más utilizados es el de la pobreza del estímulo. Parece que el niño 
aprende mucho más, y más deprisa, de lo que cabría esperar de los estímulos que lo rodean. 
Los niños están inmersos en un mar de emisiones inconexas, fragmentarias y asistemáticas y, 
sin embargo, en muy poco tiempo son capaces de extraer las complejas reglas 
morfosintácticas que subyacen a los estímulos, incluso hasta el punto de aplicarlas 
inicialmente a los casos que no corresponden («rompido» por roto, «sabo» por sé). Es el 
problema de la pobreza del estímulo que ya planteó Platón hace dos milenios, y que Noam 
Chomsky reformuló en términos actuales. 
Es cierto que los padres -sobre todo la madre, tradicionalmente- tienen un papel activo en su 
interacción con el bebé. A tal fin, emplean una forma de lenguaje que se ha dado en llamar 
maternos (traducción aproximada de motherese), que presenta características similares en 
lenguas muy distintas: frases cortas, habla lenta, entonación o prosodia exagerada, etc. 
(Fernald 1993). Sin embargo, esto no explica por sí solo la adquisición de un sistema tan 
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complejo. La principal razón es que los padres se centran sobre todo en la corrección de 
errores superficiales, como fallos en la pronunciación, algunas faltas de concordancias, 
ciertas flexiones equivocadas, etc. Nada enseñan sobre aspectos nucleares de la estructura del 
lenguaje, entre otros motivos porque tampoco ellos son conscientes de éstos. Pongamos un 
ejemplo para entenderlo mejor: el sistema de reglas que rige la referencia anafórica O 
pronominal, que toda lengua posee como parte de su núcleo duro. En la frase siguiente: 
¿Recuerdas que Miguel y sus hermanos fueron al colegio por el atajo y les salió un perro 
enorme?, pues es lo que le ha pasado hoy a Ana. 

Les se refiere de forma compacta a Miguel y sus hermanos y la partícula lo «captura» el 
significado global del episodio, es decir el hecho de ir al colegio a través de un atajo y de que 
salga un perro enorme. Todas las lenguas cuentan con recursos anafóricos como éstos, 
gracias a los cuales los significados se desplazan de unas partes a otras de la oración. Son 
relaciones de correferencia, en las que ciertos elementos inicialmente vacíos (anáforas o 
pronombres) se cargan de contenido al compartir referencias con otros elementos del 
discurso/texto. Sería inimaginable una lengua en la que hubiera que repetirlo todo cada vez. 
Cómo se transfieren las referencias de unas partes del discurso a otras es algo que ningún 
padre o madre enseña a su hijo, porque ellos tampoco reparan en ello. Este tipo de reglas son 
más complejas de lo que puede parecer a primera vista. Dependiendo de la estructura 
sintáctica, la referencia está permitida en algunos casos y bloqueada en otros: 

Juan sabe que él está muy enfermo. El sabe que Juan está muy enfermo. 

En la primera frase, la correferencia es libre y tanto Juan como él pueden referirse a la misma 
persona (aunque no obligatoriamente). En la segunda frase, la correferencia está bloqueada, 
y Juan y él son necesariamente personas distintas. No es una simple cuestión de orden; aquí 
la correferencia es libre aunque el pronombre va delante: 

Muy cerca de él, mi amigo Juan vio una serpiente. 

Este y muchos otros aspectos nucleares del lenguaje no son enseñados explícitamente a los 
niños, sino que éstos los infieren por sí mismos. Por otra parte, lo que padres y adultos 
enseñan del lenguaje tampoco obedece a una pauta sistemática o a algún plan didáctico que 
gradúe cuidadosamente la dificultad. 

Todas las comunidades tienen lenguaje 

No se ha encontrado jamás una comunidad humana carente de lenguaje. Nunca se ha 
documentado la existencia de un pueblo o una tribu «muda», sin lenguaje en el sentido en 
que lo entendemos. O que, siéndolo originalmente, consiguiera hablar gracias a la influencia 
de otro grupo humano. Una vez constituido el Homo sapiens, todas las culturas de las que 
hemos tenido noticia disponían de una lengua. La historia de las civilizaciones es rica en 
influencias mutuas, en invasiones, en relaciones de dominancia cultural y lingiística, pero 
todos los pueblos, invasores o sometidos, han contado originalmente con su propia lengua. 
Principios universales en todas las lenguas 

Todas las lenguas del mundo, sin excepción, obedecen a un conjunto de principios 
universales (Recuadro 3-1). 
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Recuadro 3-1. Órgano mental del lenguaje 


Chomsky (1986) planteó que en el cerebro humano hay un dispositivo innato para adquirir 
el lenguaje, una especie de órgano mental del lenguaje, separado de las demás capacidades 
cognitivas. Este dispositivo estaría equipado con una verdadera gramática universal: un 
conjunto de principios universales o reglas básicas comunes a todas las lenguas del mundo. 
La gramática universal sería en realidad una propiedad innata del cerebro humano, 
construida en el curso de la evolución filogenética. Impondría una serie de condiciones o 
restricciones que reducirían estrechamente las posibilidades de variación del lenguaje, 
dando lugar a las lenguas que conocemos. Estas últimas, pese a su diversidad, responderían 
a principios comunes, a un mismo diseño general. 

Dentro de la unidad existe la variedad. Junto a los principios universales, Chomsky plantea 
la existencia de parámetros específicos o materializaciones concretas de esos principios. Los 
parámetros serían responsables de la extraordinaria variedad de las lenguas. Veamos 
algunos ejemplos (Altman, 1999). 

Todas las lenguas tienen necesidad de expresar el número plural, aunque los caminos para 
hacerlo son distintos. El español o el inglés añaden una «s» a la mayoría de las palabras, 
mientras que el malayo utiliza el recurso de repetir la palabra dos veces: libros se dice 'buku 
buku' (libro libro), niños se dice 'anak anak' (niño niño), etc.; aunque el equivalente a ojo ojo 
no significa ojos ¡sino policía!. El género puede variar ampliamente de unas lenguas a otras: 
el español, el francés y el italiano tienen dos; el alemán tiene tres; el suahili añade un cuarto, 
un quinto y un sexto género; el finés no tiene ninguno, como tampoco artículos. Muchas 
lenguas, como el finés o el alemán, no tienen preposiciones y, en su lugar, utilizan sufijos 
que modifican la terminación de las palabras (4 en alemán y 15 en finés), etc. Todos éstos 
son ejemplos de variaciones en la forma de codificar la información gramatical. 

Lo innato sería una predisposición básica que puede concretarse de formas distintas. Según 
Chomsky (1986), la gramática universal es un sistema muy estructurado que sólo se 
implementa parcialmente en cada lengua. Todo el sistema está asociado a un conjunto de 
parámetros, cada uno de los cuales consta de un conjunto finito de valores posibles. Una vez 
que se fijan los valores de los parámetros, el sistema entra en funcionamiento. En cierto 
modo, la tarea del niño que adquiere su primera lengua consiste en descubrir cuáles son los 
valores concretos que adoptan los parámetros para esa lengua. Es como si la gramática 
universal se compusiera de muchos interruptores o clavijas que pueden tener determinadas 
posiciones, y los parámetros especifican la posición particular que adopta cada interruptor. 
De este modo, según Chomsky, los principios universales lingiísticos garantizan la unidad 
básica del lenguaje, mientras que los parámetros determinan las particularidades de cada 
lengua. 

A lo largo de los años, Chomsky fue adoptando distintas posiciones teóricas, pero su idea 
innatista de base permaneció inalterada. Su último planteamiento se orienta en la línea del 
programa minimalista (Hauser, Chomsky y Fitch, 2002) que centra la singularidad del 
lenguaje humano en los mecanismos de la recursividad, los cuales permiten un número 
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infinito de posibilidades a partir de un conjunto finito de elementos. 

Aunque la idea central que subyace al planteamiento chomskiano ha sido compartida por un 
amplio sector de la comunidad científica, hay que decir que su aceptación no es unánime. 
Uno de los máximos representantes actuales de la posición opuesta es el canadiense Paul 
Churchland, profesor de filosofía de la mente de la Universidad de California en San Diego. 
Este autor defiende que el cerebro humano no es radicalmente distinto de cualquier otro 
cerebro animal, y no contiene ningún supuesto «órgano mental» responsable del lenguaje. 
¿Quién tiene razón? El interrogante, como tantos en psicología, sigue abierto. 


Y esto es así aunque muchas comunidades hayan pasado su existencia sin contacto con el 
resto del planeta (tribus amazónicas, etc.). Como se ha mencionado con anterioridad, todas 
las lenguas están construidas sobre la base de la dualidad de estructura o doble articulación: 
fonemas-palabras y palabras-oraciones. En todas el signo lingúístico es simbólico y 
arbitrario, sin semejanza física con el referente. Y todas ellas ofrecen su extraordinaria 
potencialidad creadora, la explosión productiva que caracteriza al lenguaje humano. En todas 
las lenguas, la unidad básica del significado es la oración bimembre, formada por un sujeto y 
un predicado. "Todas tienen sustantivos, verbos, adjetivos y pronombres, es decir, las partes 
principales de la oración. Todas construyen sus preguntas según las mismas reglas básicas. 
Sería mucha casualidad, si no actuara algún principio subyacente de raíz biológica. 

En su libro, Pinker (1995) cuenta la historia de cómo se descubrió en tiempos recientes todo 
un nuevo tronco lingúístico. Durante la década de 1920 se creía que, salvo zonas de la selva 
amazónica, ningún rincón del planeta quedaba por explorar. En la isla de Nueva Guinea, la 
segunda del mundo por tamaño, nadie imaginaba que sus erizadas cordilleras centrales 
pudieran estar habitadas. Al descubrirse oro en las corrientes que bajaban de ellas, se desató 
la fiebre por el preciado metal y se inició la exploración de las tierras altas. La sorpresa fue 
mayúscula al comprobar que, en contra de lo supuesto, las cimas que eran visibles desde una 
costa de la isla no eran las mismas que se veían desde la costa opuesta. Por el contrario, la 
isla era mucho mayor de lo pensado y, suspendida allá arriba, se extendía una inmensa 
meseta compuesta de múltiples valles donde vivían un millón de habitantes, aún en la Edad 
de Piedra. Habían estado aislados del mundo exterior desde, al menos, 40.000 años. El 
lingúista Leahey comprobó, a lo largo de los años, que allí se hablaban unas 800 lenguas 
distintas, en una de las zonas del mundo de mayor densidad lingúística. Eran tan diferentes a 
otras lenguas que hubo que inaugurar un nuevo tronco lingúístico para su clasificación: la 
familia Papua, que incluye idiomas como el asmato, el marindo, el chimbú, etc. Pese a todo, 
eran lenguas que respondían también exactamente a los mismos principios básicos de las 
restantes lenguas del mundo. 

Cuando los lingúistas estudian las lenguas a lo ancho y largo del planeta, una realidad se 
impone: no hay lenguas más sofisticadas o primitivas que otras. Hay pueblos menos 
avanzados desde el punto de vista tecnológico, pero sus lenguas no son primitivas. Puede 
haber comunidades en la Edad de Piedra, pero las lenguas que hablan no son de la Edad de 
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Piedra; al contrario, son tan complejas como cualquier otra. No se trata de ser políticamente 
correctos, es la constatación de un fenómeno real. 

Lenguas criollas 

Las lenguas del mundo son entidades milenarias que han ido evolucionando a través de los 
siglos. Pero, ¿es posible que una lengua emerja de la nada, en el plazo de una generación? En 
cierto modo es lo que sucede con las lenguas criollas. Han surgido, sobre todo, en situaciones 
de grandes plantaciones de monocultivo (caña de azúcar, café, tabaco, algodón), donde se 
han juntado a cientos de esclavos o trabajadores de orígenes geográficos muy dispares, 
forzados a convivir durante años. Lo que suele pasar en estos casos es que, al principio, se 
crea espontáneamente una jerga rudimentaria, un lenguaje macarrónico (pidgin) que permite 
comunicar mensajes elementales relacionados con el trabajo o la subsistencia. Lo 
extraordinario es que la generación siguiente, los hijos de esos esclavos o trabajadores, 
desarrollan una lengua nueva (criolla) con el mismo grado de complejidad que cualquier otra 
lengua del mundo. 

Este fenómeno se ha repetido en los últimos siglos por obra de las potencias coloniales, en 
islas tropicales y áreas litorales (Cabo Verde, Hawai, Seychelles, Guayana, Jamaica, Haití, 
etc.). Son zonas poco habitadas, cuya población local no cubre las necesidades de mano de 
obra y obliga a los colonos a llevar en barco obreros o esclavos, según los casos, desde 
distintas partes del mundo. 

El ejemplo mejor conocido ha sido el de las plantaciones de azúcar de Hawai, gracias a los 
estudios del lingilista Derek Bickerton (Bicker-ton, 1983). A finales del siglo XIX y 
principios del XX, se trasladó a un gran número de trabajadores desde África oriental y 
occidental, Corea, Japón, China, Portugal, Filipinas y otros lugares remotos. Como cabe 
imaginar, la macedonia de lenguas sería impresionante. El escaso contacto directo entre 
colonos y trabajadores, y el exiguo número de hablantes de la lengua colonial, impidió que 
ésta se impusiera como lengua franca de intercambio. En su lugar, se fraguó un pidgin o 
lenguaje macarrónico, basado en el idioma polinesio hawaiano, que sirvió inicialmente para 
el contacto entre los nativos de las islas y la gente de la plantación. "Tras la anexión de Hawai 
por Estados Unidos en 1898, este pidgin fue adquiriendo una importante base de inglés. Sin 
embargo, el pidgin es un medio de comunicación muy rudimentario, formado por cadenas 
inconexas de palabras tomadas en préstamo y sin apenas flexiones gramaticales. Su 
vocabulario y sintaxis son muy primarios. Artículos, preposiciones, verbos auxiliares y otras 
partículas brillan por su ausencia. 

Bickerton demostró que la generación siguiente de niños y niñas, criados en ese ambiente de 
pidgin, desarrollaron espontáneamente un idioma nuevo tan perfecto y complejo como 
cualquier otro. Estos niños tenían pocas oportunidades de contacto prolongado con sus 
padres, dada la jornada laboral, y permanecían la mayor parte del tiempo juntos, al cuidado 
de algún adulto que les hablaba en pidgin. No tuvieron, por lo tanto, la oportunidad de 
desarrollar la lengua y la cultura de sus progenitores. Muchos de ellos eran, además, fruto de 
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matrimonios mixtos. Sin embargo, les bastó que, a la edad en que cualquier niño aprende su 
lengua materna, ellos fueran expuestos a un estímulo tan pobre como el pidgin macarrónico. 
Bickerton estudió con detenimiento esta nueva lengua criolla y documentó sus interesantes 
hallazgos. El criollo hawaiano tenía un vocabulario con fuerte base de inglés, pero su 
gramática tenía poco que ver con la anglosajona. La nueva lengua también empleaba 
auxiliares y codificaba el tiempo, el modo y el aspecto verbal, pero lo hacía por otros 
caminos. Por ejemplo, si en inglés el tiempo pasado se señala con el sufijo -ed, en el criollo 
hawaiano hay un tiempo, denominado anterior, que se codifica con la partícula «wen» si el 
hablante es joven, y con la partícula «bin» si el hablante es mayor. Las situaciones 
hipotéticas o imaginarias, que en inglés se codifican con el modo condicional, en criollo se 
hace a través de una partícula, «go». El criollo establecía, incluso, distinciones gramaticales 
que no existen en inglés. Por ejemplo, la frase «John went to Honolulú to see Mary» (John 
fue a Honolulú a ver a Mary), no especifica si, efectivamente, John vio a Mary o no la vio. 
En la gramática criolla esta ambigiúedad se resuelve con el uso de partículas diferentes. 
Uno de los rasgos que más llamó la atención de Bickerton fue la uniformidad del criollo de 
Hawai a través de los hablantes. En contraste, el pidgin anterior, además de pobre, era 
extremadamente variable por influencia de la lengua nativa de cada hablante. Así, los 
japoneses hablaban el pidgin con el verbo al final de la frase, como ocurre en japonés, 
mientras que los filipinos, por la misma razón, lo colocaban al principio. Pero el criollo no 
presentaba este tipo de variaciones debidas el origen de los hablantes. 
Más allá del caso de Hawai, Bickerton se plantea que todas las lenguas criollas, aparecidas 
en sitios muy diversos y sin conexión entre sí, presentan importantes semejanzas 
estructurales. Sugiere que el elemento que es común a todas ellas podría constituir la base de 
la adquisición del lenguaje por los niños de cualquier parte del mundo. 

e Bases genéticas del lenguaje 
Los argumentos considerados en el apartado anterior sugieren el carácter biológico del 
lenguaje, aunque no constituyen una prueba definitiva. La demostración definitiva de la 
fundamentación biológica del lenguaje sería encontrar sus mecanismos genéticos. Durante 
mucho tiempo se planteó un acalorado debate sobre el papel de la herencia y el ambiente en 
desarrollo del lenguaje. Expresado en otras palabras: ¿en qué medida el lenguaje es genético 
v en qué medida es una conducta aprendida? Hoy en día no hay duda de que el lenguaje es el 
resultado de ambos factores, aunque algunos investigadores atribuyen un papel principal a la 
genética, y otros, al ambiente. No obstante, para que se produzca un desarrollo normal del 
lenguaje ambos factores deben funcionar adecuadamente. Por una parte es fundamental el 
papel de los genes para que se produzca la formación de las áreas cerebrales implicadas en el 
lenguaje y, por otra, lo es el del ambiente para que esas áreas lleguen a realizar su función. El 
material genético constituye el genotipo, que es lo que determina el potencial lingúístico del 
individuo. Pero la interacción de los genes con el ambiente produce el fenotipo, que define 
realmente sus capacidades lingúísticas. Una alteración en los genes acarrea trastornos 
lingúísticos, como ocurre en la alteración conocida como trastorno específico del lenguaje o 
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en la dislexia. Pero también alteraciones ambientales pueden impedir el desarrollo normal 
del lenguaje como ocurre en los casos de niños criados en un ambiente de privación 
lingúística. 

La investigación sobre la posible base genómica del lenguaje está todavía en sus inicios. La 
mayoría de los investigadores consideran que deben ser varios los genes implicados en el 
lenguaje, pero hay uno cuya relación con el lenguaje parece estar fuera de toda duda, hasta el 
punto de que se lo conoce con el nombre de «gen del lenguaje», que es el FOXP2. Sin 
embargo, no es un gen específico del lenguaje, ya que lo que hace es regular la expresión de 
otros muchos genes durante el desarrollo embrionario. 

De acuerdo con Stromswold (2001), si los estudios genéticos fallaran en revelar evidencias 
de la genética del lenguaje, ello podría deberse a dos razones distintas. Una posibilidad es 
que el lenguaje no sea heredable ni tenga tal base genética. Otra posibilidad es que la 
hipótesis de la herencia del lenguaje sea correcta, pero que su base genética sea la misma 
para todos los individuos. En este caso, la dotación genética del lenguaje sería universal e 
idéntica para todas las personas de la misma manera que lo es la que hace que todas nazcan 
con exactamente cinco dedos en cada mano, sin ninguna variación entre individuos. Los 
estudios que buscaran diferencias genéticas entre individuos sanos fallarían en encontrarlas. 
Alternativamente, la función lingiúística podría ser más parecida a la talla, o longitud del 
cuerpo, cuya base genética es variable de un individuo a otro. A priori es difícil decidir entre 
ambas opciones. Por ejemplo, los niños presentan diferencias en sus ritmos de adquisición 
lingúística, pero, en esencia, ésta sigue las mismas pautas básicas para todos. 

Un método para buscar la posible base genética del lenguaje es comparar la dotación 
genética de individuos sanos con la de individuos que sufren alguna clase de anomalía 
lingiúística heredable. El caso paradigmático ha sido el de la familia KE, que llamó la 
atención de la comunidad científica a raíz de una publicación en los años noventa (Hurst et 
al., 1990). En ella se documentaba la existencia de una familia inglesa, cuya mitad de sus 
miembros, a lo largo de tres generaciones, sufrían un raro trastorno hereditario que 
aparentemente afectaba al lenguaje de forma selectiva. Originalmente se describió como una 
dispraxia verbal que dificultaba la expresión y articulación del lenguaje, más que su 
comprensión. Por otra parte, la inteligencia y la audición de los individuos afectados estaban 
dentro de los límites normales. Según la distribución familiar, este trastorno se transmitía de 
modo autosómico dominante, es decir, no iba ligado al sexo del portador y bastaba que uno 
de los progenitores estuviera afectado para transmitirlo a los hijos. Desde entonces se han 
realizado varios estudios en esta familia (véase una revisión en Vargha-Khadem et al., 2005) 
(Recuadro 3-2). 


Recuadro 3-2. Incidencia familiar de los trastornos de lenguaje 


Si los trastornos evolutivos del lenguaje tuvieran una base hereditaria, su incidencia debería 
ser mayor entre los familiares de un individuo que padece el trastorno (sujeto probando), 
que entre los familiares de un individuo que no lo padece (sujeto de control). Es decir, más 
sujetos probando que sujetos de control deberían tener una historia familiar positiva del 
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trastorno. 

Stromswold (1998) revisó 18 estudios familiares sobre el trastorno específico del lenguaje. 
Éste es un trastorno evolutivo que se manifiesta por problemas graves de expresión y 
comprensión del lenguaje, no asociados a pérdida auditiva, retraso mental o trastorno 
emocional. Del total de estudios, siete incluían sujetos de control además de los sujetos 
probando; en todos ellos se constató que la historia familiar positiva era mayor en los 
sujetos probando que en los controles. La incidencia familiar en los que padecían el 
trastorno oscilaba entre el 24 y el 78%, mientras que en los controles era entre 3 y 46%. 

Los resultados de éstos y otros trabajos indican que, aunque los trastornos del lenguaje son 
un conjunto heterogéneo, algunos factores genéticos podrían desempeñar un papel 
significativo en muchos de ellos. 

Hay que señalar que en los trabajos de este tipo se debe tener cuidado a la hora de 
interpretar los datos. Es posible que un niño que convive con un padre o un hermano con el 
lenguaje seriamente deteriorado, tenga más probabilidades de desarrollar él mismo un 
lenguaje alterado por influencia ambiental. En este caso sería el resultado de la mera 
exposición a un patrón lingúístico anormal y no de una predisposición genética. Es lo que se 
conoce como la hipótesis del entorno lingiiístico desviado. Sin embargo, esta hipótesis 
establece una serie de predicciones que no han sido confirmadas por los datos. Una de ellas 
es que los niños con las alteraciones más graves deberían proceder de familias cuyos 
miembros también padecieran trastornos muy graves del lenguaje, pero parece que no 
ocurre así. Otra es que el tipo de déficit mostrado por el niño debería parecerse al déficit 
lingúístico del padre o hermano afectado, pero tampoco los datos apoyan este supuesto 
(Neils y Aram, 1986). En nuestra sociedad, son las madres, más que los padres, quienes 
interaccionan con los bebés e influyen en su desarrollo lingúístico inicial; según la hipótesis 
del entorno lingúístico desviado, un niño con una madre afectada tendría más probabilidades 
de desarrollar una alteración lingúística que un niño con el padre afectado, pero esto 
tampoco sucede (Tomblin y Buckwalter, 1994). 


Lo importante es determinar si el trastorno de la familia KE es específicamente lingúístico o 
es de carácter más general. Los tests lingiiísticos aplicados evaluaron la pronunciación, el 
uso de la gramática, el manejo de los significados y, en general, el cociente intelectual (CI) 
verbal. En todos ellos, la puntuación de los miembros afectados era inferior a la de los 
miembros sanos, aunque había solapamiento entre ambos grupos en algunos tests. Las 
dificultades eran mayores en las tareas de producción que en las de comprensión. Las 
pruebas que mejor discriminaban entre miembros afectados y sanos eran las tareas de 
repetición y las praxias orofaciales. La repetición de palabras y, sobre todo, la repetición de 
seudopalabras multisilábicas (no existentes en inglés, aunque pronunciables) era la tarea más 
difícil para los afectados, y no presentaba solapamientos de puntuaciones entre los dos 
grupos. También aparecían afectadas las praxias orofaciales, o imitación de gestos de cierta 
complejidad con la lengua, los labios y los músculos de la cara. 
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Como ocurre en muchas alteraciones neurofuncionales del lenguaje (dislexia, retraso simple 
del lenguaje, etc.), las pruebas radiológicas no revelan una lesión concreta en ninguna parte 
del cerebro, pero técnicas avanzadas de volumetría cerebral revelan un tamaño 
anormalmente reducido de una estructura concreta: el núcleo caudado de cada hemisferio 
cerebral. Además, su tamaño se correlaciona negativamente con el rendimiento en las 
pruebas de praxias orofaciales y repetición de seudopalabras; es decir, a menor volumen, 
peor desempeño. 

Los genetistas vieron en la familia KE un banco de pruebas inmejorable para buscar la 
existencia de algún hipotético gen del lenguaje. Se trataba de un trastorno claramente 
hereditario y monogénico, con muchos miembros afectados en una misma familia, y un raro 
déficit apararentemente específico del lenguaje. La idea era comparar el genoma de los 
individuos afectados y los no afectados de la familia e identificar las secuencias de ADN que 
diferían entre ambos. Al ser parientes, todos ellos compartían cena porción muy significativa 
del genoma, siendo más fácil localizar lo que diferencia al pupo patológico. 

En 2001, un equipo de la Universidad de Oxford dirigido por Anthony Monaco encontró una 
secuencia de ADN que aparecía alterada (mutada) sistemáticamente en todos los miembros 
de la familia KE afectados (Lai et al., 2001). El hallazgo se vio reforzado al descubrirse otra 
persona (CS), que nada tenía que ver con la familia KE, con los mismos síntomas y cuyo 
ADN también presentaba una mutación semejante (Lai et al., 2000). La alteración se localizó 
en el cromosoma 7. La mutación en era mínima, simplemente una base nitrogenada había 
sido reemplazada por otra (adenina por guanina) en un punto determinado de la secuencia, 
pero esta sustitución tenía consecuencias en cadena incalculables sobre la síntesis posterior 
de aminoácidos y proteínas. 

El nombre del gen donde ocurría la mutación es FOXP2 y pertenece a una familia de genes 
(genes forkhead) de gran relevancia genética. El descubrimiento se publicó en Nature (Lai et 
al., 2001) e inmediatamente tuvo, como cabía esperar, una gran repercusión mediática BBC 
y otros medios internacionales). La noticia apareció en todos los diarios del mundo: por 
primera vez se había localizado un sitio en el ADN, cuya alteración parecía afectar 
directamente al lenguaje. Así, comenzó a hablarse del FOXP2 como el gen del lenguaje, lo 
cual todavía es una cuestión abierta, en términos estrictamente científicos. 

Como ya señalamos, el papel exacto del gen FOXP2 en relación con el lenguaje es aún 
controvertido. Su interpretación ha atravesado diversas etapas, dependiendo de la 
caracterización efectuada del trastorno que provoca. En una primera perspectiva se hablaba 
de un déficit fundamentalmente lingiístico que afectaba a la adquisición de las reglas 
morfosintácticas; de hecho, se llegó a llamarlo el «gen de la gramática», concepto que 
encajaría perfectamente en la teoría de Chomsky y sus seguidores. Posteriormente, se lo 
consideró más como un gen implicado en la secuenciación compleja de patrones motores 
articulatorios, patente sobre todo, en la tarea de repetición de seudopalabras (Watkins, 
Dronkers y Vargha-Khadem, 2002). 
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Hay dudas sobre si la anomalía de la familia KE es específicamente lingúística o de tipo 
motor más amplio. Para algunos autores, el déficit principal consistiría en una dificultad en la 
organización de secuencias rápidas y complejas de movimientos orofaciales, siendo al hablar 
cuando esto se manifiesta mejor. Sin embargo, ciertas consideraciones apuntan en sentido 
contrario. No se observa ninguna otra dificultad motora en las manos, los brazos y el resto 
del cuerpo, aunque, como señalan Vargha-Khadem et al. (2005), para asegurarlo tal vez se 
requerirían tareas manuales equiparables en complejidad a la del habla, como la ejecución de 
instrumentos musicales o la mecanografía avanzada. Por otra parte, el trastorno no está 
restringido a la producción del lenguaje oral, sino que también afecta a la comprensión de 
oraciones con estructuras complejas y a la fluidez de la escritura. En cualquier caso, la 
naturaleza estrictamente lingiística del trastorno sigue siendo una cuestión abierta. 

Para concluir, no hay que olvidar que el hipotético enlace entre estructuras genéticas y 
lenguaje, en caso de existir, probablemente es complejo y no guarda una relación de uno a 
uno entre genes y funciones. Esto es lo habitual en muchas características hereditarias de 
naturaleza poligénica, es decir, en las que intervienen varios genes para un rasgo. Nadie sabe 
en realidad cuántos genes, de haberlos, son necesarios para construir la capacidad lingúística 
y, lo que es más importante, cómo interaccionan estos genes entre sí. Plomin y Dale (2000) 
argumentan que es improbable que un atributo tan complejo como el lenguaje sea el 
resultado de un pequeño número de genes actuando solos o en combinación con el ambiente; 
por el contrario, es más verosímil que las habilidades lingiísticas sean el resultado de 
muchos genes. A la inversa, un mismo locus se ha visto implicado en diferentes fenotipos o 
manifestaciones observables. El locus 7q31 del FOXP2, también aparece asociado en 
algunos estudios con otros cuadros, como el autismo o el síndrome de Gilíes de la Tourette. 
Los trabajos existentes sobre vinculación entre genes y trastornos del lenguaje escrito 
apuntan hacia una heterogeneidad genética. En el caso de la dislexia, se han identificado 
hasta seis locus distintos del genoma verosímilmente asociados con la disfunción lectora. 

e ¿Existe un período crítico para el lenguaje? 

Se trata de una cuestión directamente relacionada con la dimensión biológica del lenguaje. 
Sabemos que existe una relación entre la maduración biológica del individuo y su desarrollo 
lingúístico, de manera que ciertas etapas no pueden alcanzarse antes de una edad 
determinada. Muchos autores han defendido la existencia en el ser humano de un período 
evolutivo especialmente importante, o crítico, para el desarrollo del lenguaje, de modo 
análogo a lo que ocurre en otras especies animales respecto a ciertas conductas. El concepto 
de período crítico es usual en zoología, sobre todo en las aves y su conducta del canto. Por 
ejemplo, los pinzones machos desarrollan un complejo canto para atraer a las hembras. A 
pesar de su complejidad, el canto permanece fijo e inmutable durante la vida adulta desde los 
15 meses de edad. Ahora bien, si el polluelo de pinzón no está expuesto al canto de su 
especie durante el período previo a esa edad, no desarrollará jamás un canto normal. Si se 
aisla a un pinzón joven de los otros pinzones adultos o se lo ensordece temporalmente 
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durante sus primeros 15 meses de vida, quedará mudo o desarrollará un canto anómalo que 
nunca podrá corregir, aunque se exponga nuevamente al canto adulto (Thorpe, 1972). 
¿Ocurre algo análogo en la especie humana con respecto al lenguaje? ¿Existe un período en 
la vida del ser humano durante el cual está especialmente predispuesto para desarrollar el 
lenguaje y, una vez pasado, ya no es posible alcanzar un lenguaje normal si, por cualquier 
circunstancia, se ha visto privado de un entorno lingúístico en su transcurso? 

El principal defensor de la existencia de un período crítico para el lenguaje ha sido Eric H. 
Lenneberg en su libro, ya clásico, Fundamentos biológicos del lenguaje (Lenneberg, 1975, 
original de 1967). Este autor, profesor de la Universidad de Harvard, ya desaparecido y uno 
de los máximos estudiosos de los fundamentos biológicos del lenguaje, situaba dicho período 
entre los 2 años de edad y el comienzo de la adolescencia, puesto que «...después de la 
pubertad, las capacidades de autoorganización y ajuste a las demandas fisiológicas del 
comportamiento verbal disminuyen rápidamente. El cerebro parece haber entrado en una fase 
de estabilidad en la que las habilidades más primarias y elementales que no han sido adqui- 
ridas hasta ese momento permanecen, por regla general, defectuosas durante toda la vida» (p. 
158). Lenneberg se basó fundamentalmente en los cinco argumentos siguientes en su defensa 
de un período crítico en el desarrollo del lenguaje (Lenneberg, 1975). Hoy, algunos de estos 
argumentos han perdido parte de su fuerza: 

1. El desarrollo del lenguaje en los niños gravemente retrasados se detiene en la pubertad. 13 
Por ejemplo, los niños con síndrome de Down y que presentan un retraso general en su 
capacidad mental, siguen el mismo curso general de desarrollo de todos los niños, pero a un 
ritmo bastante más lento. No obstante, según Lenneberg, estos niños nunca llegan a alcanzar 
una competencia lingúística completamente normal, debido a que el desarrollo del lenguaje 
se detiene al pasar la pubertad, aunque, en teoría, aún quedaría un trecho por recorrer. 

2. Las posibilidades de recuperación del lenguaje tras una lesión cerebral son mayores en los 
niños pequeños que en los adultos. Si el daño cerebral (traumatismo, infección, intoxicación, 
etc.) se produce durante la infancia, la recuperación del lenguaje generalmente es rápida y 
bastante completa. Según Lenneberg, si un niño menor de 2 años sufre una lesión en el 
hemisferio cerebral encargado del lenguaje -el izquierdo, en la mayoría de las personas-, el 
desarrollo del lenguaje apenas resultaría alterado porque el otro hemisferio se haría cargo de 
esa función; esto ocurriría incluso en los casos más extremos de pérdida completa del 
hemisferio izquierdo. La razón de ello residiría en que el período crítico aún no ha 
comenzado y la plasticidad del sistema nervioso permitiría que el control del lenguaje pasara 
a depender de otras estructuras neuroanatómicas no afectadas. Estas mismas lesiones suelen 
producir, sin embargo, secuelas menos reversibles en adolescentes y adultos, porque ya se ha 
perdido la plasticidad inicial y se ha fijado la especialización funcional de las diversas 
estructuras neurales. 

3. La adquisición de una segunda lengua ha constituido otra fuente de argumentación a favor 
del período crítico. Existen datos que indican que el acento proporcionado por la lengua 
materna se hace prácticamente inmutable después de la pubertad. Un adulto que aprende un 
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nuevo idioma tiende a conservar su antiguo acento y lo más probable es que su habla nunca 
llegue a confundirse con la de un nativo, desde el punto de vista fonético. Sin embargo, un 
niño adquirirá la segunda lengua sin ningún acento extranjero. Tal es el caso, sobradamente 
conocido, de los emigrantes que conservan toda la vida su acento de extranjero en el país 
receptor, mientras que sus hijos adquieren perfectamente la pronunciación de la segunda 
lengua, sin distinguirse de los otros niños nativos de la misma edad. 

4. El período crítico coincidiría con el período de lateralización del lenguaje. Para 
Lenneberg, el proceso de especialización hemisférica en la función lingúística se 
desarrollaría entre los 2 y los 14 años de edad, es decir, el mismo período durante el cual se 
adquiere y se desarrolla plenamente el lenguaje. De este modo, la capacidad de adquisición 
lingúística guardaría estrecha relación con el paulatino proceso de especialización 
hemisférica, gracias al cual, una mitad del cerebro, la izquierda en la mayoría de las 
personas, se va haciendo cargo de los principales mecanismos neurales del lenguaje. Una vez 
que este proceso hubiese concluido, la adquisición posterior de una primera lengua sería 
problemática. 

5. El quinto argumento se apoya en los individuos que se han visto expuestos al lenguaje 
tardíamente. Los casos más llamativos son los que se ha dado en llamar «niños salvajes», 
criados sin la presencia del ser humano, o aislados de toda forma de estimulación lingúística. 
Cuando un etólogo estudia la existencia de un período crítico en una especie animal sobre la 
adquisición de una pauta conductual determinada, el experimento prototípico consiste en 
someter al animal, de forma controlada, a tiempos variables de privación y observar después 
las consecuencias que tienen sobre esa conducta. Obviamente, un experimento así no podría 
realizarse con sujetos humanos, por razones éticas; se trata del experimento prohibido, 
muchas veces mencionado. Por desgracia, la vida ha proporcionado ocasiones en los que tal 
«experimento» se ha producido con niños abandonados a edades muy tempranas, que han 
crecido apartados del contacto humano. Algunos de los casos más célebres son el del niño 
salvaje de Aveyron y, más recientemente, el de la niña Genie que veremos con detalle más 
adelante. 

Revisión de los argumentos de Lenneberg 

Hace cuarenta años, el punto de vista del profesor de Harvard era compartido por la 
comunidad científica. Hoy, sin embargo, sobre todo a partir de la década de 1980, ha dejado 
de haber un consenso unánime sobre la existencia de un período crítico para el lenguaje. 
Cuando menos, se matizan algunos de los datos que apoyan las argumentaciones de 
Lenneberg. 

Hay autores que entienden que el estancamiento del lenguaje en la pubertad de los niños con 
discapacidad psíquica se debe, sobre todo, a la falta de estimulación más que al hecho de 
haber sobrepasado el supuesto período crítico. Por otra parte, algunos estudios más recientes 
han puesto de relieve que los niños con síndrome de Down presentan un techo preestablecido 
en su desarrollo y pueden alcanzar este punto a cualquier edad, lo que en muchos casos 
sucede bastante antes de llegar a la adolescencia (Gleitman, 1984). 
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Parece haberse confirmado la mejor recuperación del lenguaje en los niños más pequeños 
tras una lesión cerebral. Esto es lógico, ya que los cerebros jóvenes tienen en general mayo- 
res posibilidades de recuperación en cualquier área cognitiva. También los monos bebés con 
lesiones cerebrales experimentales se recuperan mejor que los monos adultos. No obstante, 
aún no hay pruebas concluyentes de que el período crítico se inicie de forma repentina a los 
2 años y concluya abruptamente en la pubertad. Según Aitchison (1992), en lo que a la edad 
de inicio se refiere, Lenneberg se equivoca al suponer que los niños menores de 2 años no 
resultan afectados por lesiones en el hemisferio izquierdo. Por el contrario, los bebés que han 
sufrido una ablación de este hemisferio en su primer año suelen tener problemas importantes 
de lenguaje. En cuanto a la terminación repentina del período crítico al llegar a la 
adolescencia, se ha comprobado que a esa edad aún pueden producirse cambios sustanciales 
en el dominio del lenguaje. 

Sobre el aprendizaje de una segunda lengua hay muchos tópicos, más allá de los hechos 
comprobados. Al parecer, los niños pequeños pueden adquirir mejor que los adultos los 
rasgos fonéticos y prosódicos de la segunda lengua, pero en lo que se refiere a la adquisición 
de su gramática no parece demostrada una superioridad clara. En todo caso, una mayor 
dificultad por parte de los individuos adultos podría reflejar también un anquilosamiento 
general de sus habilidades de aprendizaje, tanto por razones biológicas como socioculturales. 
No obstante, sí hay un acuerdo amplio en admitir un subperíodo crítico para un aspecto muy ] 5 
concreto: la fonética de una segunda lengua. Parece que a partir de cierta edad, que algunos 
autores fijan en torno a los 10-12 años, y otros bastante antes, hay ciertos rasgos de la fo- 
nética materna que inevitablemente «contaminan» a la segunda lengua y le confieren un 
acento extranjero a oídos de los hablantes nativos de ésta. Quien empieza a aprender una 
lengua a partir de esa edad, probablemente nunca llegará a pasar por un hablante nativo en su 
pronunciación, por mucho entrenamiento que reciba. Hay magníficos hispanistas 
anglosajones, como lan Gibson, con un vocabulario castellano riquísimo y un manejo hábil 
de la gramática, pero se morirán sin perder su acento extranjero; al escucharlos nadie 
pensaría que es un señor de Guadalajara. Es casi seguro que nunca alcanzarán los finísimos 
microajustes motores que hacen que una emisión lingúística suene a nativa, aunque esto 
repercuta poco en la inteligibilidad y comunicación de los mensajes. Al respecto, algunos 
autores, como James Flege, tienden a pensar que la verdadera dificultad del hablante tal vez 
no resida tanto en la pronunciación, como en la percepción de los sonidos de la segunda 
lengua: es decir, no hablarían como un nativo porque, en realidad, no percibirían los sonidos 
de la segunda lengua como un nativo; pero esto es sólo una hipótesis. 

Si el período crítico coincide en realidad con el proceso de lateralización hemisférica es algo 
que también se pone en cuestión. Para Lenneberg, la especialización cerebral ocurre entre los 
2 y los 14 años de edad, pero, a la luz de lo que sabemos hoy, puede decirse que acontece 
bastante antes de lo que él supone. Hay incluso bebés menores de 1 año que ya dan muestras 
de lateralización. En tareas experimentales de escucha dicótica, los niños de 2 Vi a 3 años 
revelan un uso preferente del hemisferio izquierdo en el procesamiento del lenguaje 
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(Kinsbourne y Hiscock, 1987). Según otros autores, el proceso de lateralización ha finalizado 
en lo esencial hacia los 5 años de edad. 

El argumento basado en los individuos privados de estimulación lingúística se abordará más 
detenidamente a continuación en relación con los «niños salvajes». Su principal debilidad es 
que no puede descartarse la existencia de un déficit de origen en estos niños. 

Niños salvajes 

A lo largo de la historia se han relatado episodios de niños abandonados o perdidos desde su 
nacimiento O a una edad muy temprana, que han sido criados en estado salvaje por lobos, 
cerdos, ovejas, osos y otros animales. En otros casos, los niños consiguieron sobrevivir por sí 
mismos, sin que aparentemente hayan crecido en compañía animal. Algunos casos raros se 
criaron con sus padres en absoluto aislamiento, como Genie. Una colección fascinante de 
estos niños está recogida en el libro Wolf children, de Lucien Malson (1972), y ha sido 
resumida por David Crystal en su Enciclopedia del lenguaje (1994) (Tabla 3-1). 


Tabla 3-1. Relación de niños aislados de la sociedad a lo largo de la historia (Malson, 1972) 


Descubrimiento Descubrimiento 


Casos Casos 
Fecha Edad Fecha Edad 
Niño-lobo de Hesse 1344 7 Niño-lobo de Sekandra 1872 6 
Niño-lobo de Wetteravia 1344 12 Niño de Sekandra 1874 10 
Niño-oso de Lituania 1661 12 Niño-lobo de Kronstadt ? 23 
Niño-oveja de Irlanda 1672 16 Niño de Lucknow 1876 ? 
Niño-ternero de Bamberg 1680 ? Niño de Jalpaiguri 1892 8 
Niño-oso de Lituania 1694 10 Niño de Batsipur 1893 14 
Niño-oso de Lituania ? 12 Niño de Sultanpur 1895 ? 
Niño holandés secuestrado 1717 19 Niña de nieve de Justedal ? 12 
Dos niños de los Pirineos 1719 ? Amala de Midnapur 1920 2 
Peter, de Hanover 1724 13 Kamala de Midnapur 1920 8 
Niña de Sogny 1731 10 Niño-leopardo de India 1920 ? 
Jena de Lieja ? 21 Niño-lobo de Maiwana 1927 ? 
Tomko, de Hungría 1767 ? Niño-lobo de Jhansi 1933 ? 
Niña-oso de Fraumark 1767 18 Niño-leopardo de Dihungi ? 8 
Victor de Aveyron 1800 11 Niño de Casamance 1930 16 
Gaspar Hause de Nuremberg 1828 17 Assicia de Liberia 1930 ? 
Niña-cerdo de Salzburgo ? 22 Niño de Pennsylvania 1938 6 
Niño de Husanpur 1843 ? Niño confinado de Ohio 1940 ? 
Niño de Sultanpur 1843 ? Niño-gacela de Siria 1946 ? 
Niño de Sultanpur 1848 ? Niño de Nueva Delhi 1954 12 
Niño de Chupra ? ? Niño-gacela de Mauritania 1960 ? 
Niño de Bankipur ? ? Niño-mono de Teherán 1961 14 
Niño-cerdo de Holanda ? ? Genie de Los Ángeles 1970 13 


Niño-lobo de Holanda 
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En la mayoría de las ocasiones, la información disponible ha sido muy escasa; a veces, un 
simple recorte de prensa. Unos pocos casos se han estudiado con más detalle, como en las 
historias de Victor de Aveyron, Gaspar Hauser de Nuremberg, Amala y Kamala de 
Midnapur y Genie de Los Angeles. 

Sólo algunos autores describen las capacidades lingúísticas de los niños al ser descubiertos; 
en estos casos, todos coinciden en la ausencia de habla y en su incapacidad para entenderla. 
La mayoría de los intentos de enseñarles a hablar terminaron en fracaso. Se dice que los 
casos de 1694 (niño-oso de Lituania), 1731 (niña de Sogny) y 1767 (niña-oso de Fraumark) 
llegaron a hablar un poco, y que Tomko de Hungría, descubierto en 1767, consiguió 
aprender eslovaco y alemán. También se ha dicho que el niño de Bankipur del siglo pasado 
aprendió algo del lenguaje de los signos. Pero la información es insegura y los resultados de 
los casos mejor documentados suelen ser modestos (Crystal, 1994). 

Victor, de Aveyron, no pudo llegar a hablar, aunque era capaz de comprender y leer en cierto 
grado. Kamala, de Midnapur, aprendió en parte a hablar y a utilizar signos. De acuerdo con 
Crystal (1994), los casos de la lista que han registrado resultados más notables han sido el de 
Gaspar Hauser, que consiguió un nivel aceptable de habla, y el de Genie, que aprendió 
bastantes palabras y realizó importantes progresos tras su descubrimiento, como luego 
veremos en detalle. 

El caso de Victor, el niño salvaje de Aveyron, es tal vez el más conocido y considerado 
como el prototipo de «niño salvaje», gracias sobre todo a su popularización por el film de 
Truffaut. En enero de 1800 se encontró a un niño en los bosques próximos a la ciudad de 
Saint-Sernin, en el distrito francés de Aveyron. Aparentaba unos 11 ó 12 años de edad, iba 
prácticamente desnudo, con restos de una camisa andrajosa y no profería ningún sonido, 
salvo ruidos guturales de tipo animal. Posiblemente había sido abandonado, pero no pudo 
precisarse a qué edad había ocurrido esto; todos los intentos por reconstruir su historia 
fracasaron. 

En la Francia de entonces reinaba un espíritu científico de curiosidad intelectual y de 
simpatía hacia los niños perdidos (Steinberg, 1993). El director del Instituto de Sordomudos 
de París, Sicard, oyó hablar del caso y se interesó por él, consiguiendo que ingresara en la 
institución. El director gozaba de un merecido prestigio gracias a sus éxitos con niños sordos 
que habían sido rechazados por la comunidad como retrasados. Sin embargo, no pasó mucho 
tiempo antes de que sus esperanzas se desvanecieran ante la falta de progresos de Victor. Por 
fortuna para el niño, pronto se haría cargo de su educación un joven y ambicioso médico 
llamado Jean-Marc Gaspard Itard. Fue Itard quien le dio el nombre de Victor y le dedicó un 
esfuerzo continuado durante varios años. Inventó una gran variedad de juegos y actividades 
para ayudar a que Victor se socializara y desarrollara alguna forma de lenguaje. Algunas de 
las técnicas que ensayó se usan hoy en las guarderías infantiles. 

Desgraciadamente, todos los intentos de que imitara el lenguaje oral terminaron en un 
fracaso rotundo, a pesar de que consiguió notables avances en la lectura y la escritura. Para 
Itard resultaba desconcertante esa disparidad tan marcada en Victor entre la modalidad 
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verbal y la escrita, puesto que jamás consiguió hablar más de una o dos palabras. 
Desgraciadamente, se sabía tan poco de la infancia de Victor que nunca se pudo descartar el 
que el niño fuera mentalmente retrasado o padeciera alguna lesión cerebral congénita. 
Mención aparte merecen determinadas historias de privación lingiiística por causas sen- 
soriales, como la célebre Helen sordomuda y ciega, o Isabelle, que vivió aislada con su ma- 
dre sordomuda. Helen Keller fue ciega y sorda desde la infancia a causa de una enfermedad 
contraída a los 19 meses de vida. A la edad de 7 años, sus padres contrataron a Anne 
Sullivan Macy, que alcanzó un notable éxito enseñándole el lenguaje a través del sentido del 
tacto. Helen aprendió a hablar tocando directamente los órganos articuladores (boca, labios, 
garganta) de Sullivan y otras personas, entre ellos, Alexander Graham Bell, reconocido 
investigador, educador de sordos e inventor del teléfono. Aprendió a leer y escribir con el 
alfabeto Braille y se graduó en la Universidad de Harvard, llegando a ser una brillante 
escritora y una magnífica profesora al servicio de las personas discapacitadas (Steinberg, 
1993). Esta extraordinaria historia ha sido llevada a la pantalla en más de una ocasión, 
destacando la película de Arthur Penn de 1962, El milagro de Ana Sullivan (título original 
The miracle worker). 
Isabelle (un seudónimo) estuvo encerrada con su madre muda y no empezó a aprender el 
lenguaje hasta los 6 y Vi años de edad; esto ocurría en 1938, en el estado norteamericano de 
Ohio. Su madre había sufrido una lesión cerebral a los 2 años de edad y, como resultado de 
ello, no había desarrollado habla alguna; no sabía leer ni escribir, no recibió educación y se 
comunicaba con su familia a través de gestos primitivos de su propia creación. Al cumplir 
los 22 años tuvo a su hija Isabelle. Durante el embarazo y los años siguientes la madre y su 
hija vivieron confinadas en una habitación, hasta que ambas escaparon y el caso llamó la 
atención de las autoridades. Isabelle fue ingresada en el Hospital de Niños de Columbus, sin 
presentar signos de habla, puesto que nunca había intentado comunicarse oralmente. Una 
semana después, consiguió sus primeros intentos de vocalización y en menos de 3 meses ya 
era Capaz de decir oraciones simples completas. Un año después escuchaba atentamente 
historias leídas por otra persona, y después ella las volvía a contar con su propio vocabulario 
y deteniéndose en los aspectos más importantes. Después de un año y medio, Isabelle 
formulaba preguntas con estructuras complejas. 
Helen e Isabelle alcanzaron un nivel de desarrollo lingúístico muy superior al de Victor de 
Aveyron y Genie de Los Angeles. Comparándolos, Danny D. Steinberg señala tres factores 
como principales responsables de la diferencia: a) la edad de comienzo en que ocurrió la 
privación lingúística; b) la duración de la privación, y c) la posibilidad de que existiera desde 
un principio cierta incapacidad o trauma físico o psíquico en los casos de Victor y Genie. 
Finalmente, Steinberg concluye (An introduction topsycholinguistics, 1993, p. 65): 

Está claro que, desde nuestra consideración de los casos de niños salvajes, la 

situación experimental ideal para estudiar el problema de la edad crítica para el 

aprendizaje del primer lenguaje aún no se ha dado. Esperemos que nunca se dé. 
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El caso de Genie de Los Ángeles 
En noviembre de 1970 fue encontrada en Los Angeles, en el desván de su casa, una niña de 


13 años y medio que había sido criada en el aislamiento más absoluto. ¡Su padre la había 
tenido en esa pequeña habitación durante los 12 años anteriores! El grado de incomunicación 
y falta de asistencia era equiparable, e incluso superior, al de cualquier «niño salvaje» 
anterior. Esta niña, conocida como Genie, había vivido en condiciones verdaderamente 
infrahumanas. Así lo relata Susan Curtiss, la lingiista que estudió y trató a Genie durante 
varios años (Curtiss et. al., 1974, p. 529, tomado de Aitchison, 1989): 
A partir de los 20 meses, Genie fue encerrada en una pequeña habitación [...]. Su 
padre la castigaba si emitía algún sonido. Permanecía la mayor parte del tiempo 
enganchada con una correa a una sillita de bebé, y cuando no estaba así la 
introducían en un saco de dormir dentro de una cuna y la tapaban con una tela 
metálica. 
Aunque había pasado la pubertad, Genie pesaba sólo 30 kg; mo podía masticar alimentos 
sólidos, no controlaba sus esfínteres y era incapaz de mantenerse erguida. Si hacía ruido, su 
padre la golpeaba. Nunca le hablaba, aunque en ocasiones le ladraba como si fuera un perro. 
Su madre, medio ciega y atemorizada por el marido, la visitaba sólo unos instantes diarios y 
la alimentaba con comidas infantiles; durante este tiempo sólo le dirigía unas pocas palabras, 
si es que le hablaba. En la casa no había radio ni televisión, por lo que Genie tampoco tuvo 
ocasión de oír el lenguaje a través de esos medios. Los exámenes médicos parecían indicar 
que durante los primeros 20 meses había tenido un desarrollo normal hasta que presentó un 
retraso en la deambulación como consecuencia de una luxación congénita de la cadera. Este 
hecho hizo que el padre la considerara deficiente mental y la tratara de la forma descrita. Al 
poco tiempo de que Genie fuera descubierta, su padre se suicidó. 
Genie fue el seudónimo que le pusieron los investigadores que estuvieron en contacto con 
ella, porque había surgido de pronto, como el genio de una lámpara mágica. Al igual que 
Victor, durante las primeras semanas de libertad la niña mostró una gran curiosidad, pero, a 
diferencia de aquél, evidenció pronto la capacidad de comprender e imitar palabras aisladas, 
como 'mother' (madre), 'red' (rojo) o 'bunny' (conejito). Sin embargo, era incapaz de entender 
una oración simple. En general respondía sólo a gestos y a la entonación de las palabras. 
Genie despertó un gran interés -y tal vez ambiciones personales- en el mundo científico 
norteamericano de los años setenta, por lo que fue sometida a estudio de forma exhaustiva. 
Hubo en juego, además, importantes dotaciones económicas por parte de los poderosos 
National Institutes of Health (NIH) estadounidenses. 
Los tests psicológicos indicaban que su edad mental rondaba los 2 años, con un lenguaje que 
mostraba muchas de las características de esa edad. Después de unos meses de cuidado, 
Genie cambió considerablemente. Creció, ganó peso y fuerza y consiguió dar largos paseos. 
Unos meses después aprendió cientos de palabras sobre nombres de objetos; sentía una 
enorme curiosidad por los nombres de las cosas que la rodeaban. Pronto empezó a 
comprender parte del lenguaje que se hablaba en su presencia. Por ejemplo, cuando otro niño 
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era preguntado por los balones que él tenía y contestaba «tres» teniendo sólo dos, Genie 
mostraba extrañeza y le daba un tercer balón al niño, para coincidir con la respuesta dada. 
Otras anécdotas indicaban que era capaz de comprender algo más que palabras aisladas. 

La persona que estimuló y siguió más de cerca sus progresos lingúísticos fue Susan Curtiss, 
profesora de lingiística de la Universidad de California en Los Angeles (UCLA). Curtiss 
resumió lo esencial de su trabajo en su libro publicado en 1977, Genie: a psycholinguistic 
study of a modern-day wild child. 

Al cumplirse un año desde su descubrimiento, se realizó una evaluación exhaustiva de los 
progresos alcanzados por Genie en el lenguaje. Sirva de muestra los siguientes aspectos 
destacados por Steinberg (1993) en relación con la comprensión oral: 

+ Comprensión de una amplia variedad de estructuras sintácticas. Por ejemplo, las es- 
tructuras de negación, al distinguir la frase “Show me the bunny that do es not have a 
carrot” (Muéstrame el conejito que no tiene una zanahoria) frente a 'Show me the 
bunny that has a carrot' (Muéstrame el conejito que tiene una zanahoria). 

+ Comprensión de adjetivos simples como 'big' (grande) o 'little' (pequeño), etcétera. 

+ Colocación de los objetos en el espacio en relación con otros objetos, a través de las 
preposiciones 'in' (en), 'under' (bajo), 'next to' (cerca de), 'behind' (detrás), etcétera. 

* Distinción entre singular y plural. Distinción entre las conjunciones 'and' (y) y 'or' (0). 

+ Comprensión de pronombres, tiempos verbales y superlativos ('big' grande, 'bigger' 
más grande, 'biggest' el más grande). 

+ Preguntas "Wh' ('who...?', 'what...?", 'whe-re...?', etc.) (¿quién?, ¿qué?, ¿dónde?). 

Genie demostró en general buena comprensión de muchas estructuras. Sus mayores 
dificultades se centraban en las disyunciones ('either/ or”), ciertos tiempos verbales y los 
pronombres de sujeto y objeto. De forma global, su lenguaje comprensivo había avanzado 
notablemente a lo largo del primer año. 
Sin embargo, sus mejoras en el lenguaje hablado fueron mucho más lentas. Tardó varios 
años en alcanzar la fase del lenguaje telegráfico y continuar más allá con expresiones más 
complejas y maduras. A pesar de que su habla era deficiente y poco gramatical, Genie era 
Capaz de expresar relaciones de significado más complejas, que indicaban que su capacidad 
intelectual iba por delante de su capacidad lingiiística. Sirva de ejemplo el siguiente recuerdo 
suyo verbalizado: 

"Father take piece wood. Hit. Cry' (Padre tomar trozo madera. Golpear. Llorar). 
Se trataba de recuerdos suyos anteriores. Genie generalmente hablaba muy poco, sólo 
cuando se la incitaba a ello. No mostraba una conducta de verbalización espontánea, que es 
muy frecuente en los niños pequeños que están aprendiendo a hablar. Es muy probable que 
se tratara de un postefecto después de tantos años de maltrato paterno. En los niños normales 
la diferencia entre el lenguaje productivo y comprensivo decrece con el tiempo y el primero 
se aproxima al segundo; en Genie tal desfase persistió siempre. 
En total, Genie fue estudiada durante 5 años; después de ese tiempo sus avances se 
estancaron. Si se considera su punto de partida, la niña realizó progresos gigantescos, tanto 
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en lo que se refiere a su comportamiento social como lingúístico. Sin embargo, no fue capaz 
de adquirir un lenguaje gramatical. No alcanzó aspectos que son dominados por los niños 
normales antes de los 4 años. Nunca se sirvió del orden de los elementos léxicos para 
comprender frases sencillas formadas por sustantivo-verbo-sustantivo. Su lenguaje carecía de 
la mayoría de los verbos auxiliares; no empleaba pronombres personales ni adjetivos 
demostrativos como 'this' (este) o 'that' (ese, aquel). Tampoco formulaba espontáneamente 
nuevas preguntas, más allá de aquellas en las que había sido entrenada de forma intensiva. 
Finalmente, un episodio desgraciado, en uno de los muchos hogares adoptivos por los que 
pasó, la bloqueó emocionalmente contra el empleo del habla. Desde entonces, no volvió a 
abrir la boca para hablar. 

¿Período crítico para Genie? A la luz de lo acontecido con Genie poco podemos decir con 
certeza sobre la existencia o no de un período crítico para el lenguaje. De acuerdo con 
Villiers y Villiers (1984), una versión fuerte de la hipótesis del período crítico que afirme 
que un niño ha de adquirir un primer lenguaje antes de la pubertad o será completamente 
incapaz de aprenderlo después es errónea. Genie apenas poseía experiencia lingiística antes 
de la pubertad y, sin embargo, consiguió logros notables después de esa edad, mediante 
instrucción intensiva y sistematizada. Sin embargo, una versión más débil de la hipótesis del 
período crítico que defienda que el aprendizaje del primer lenguaje resulta más difícil e 
incompleto después de la pubertad podría ser cierta. En unos 7 años, Genie efectuó casi 
tantos progresos en la adquisición del lenguaje como los que realiza un niño normal en 2 0 3 
años. La dificultad que seguía mostrando Genie en cuanto a articulación coincide también 
con lo que se observa con la adquisición tardía de las segundas lenguas: que existe un 
subperíodo crítico para la adquisición de las pautas de pronunciación. 

Por otra parte, las condiciones extremas en las que vivió Genie no permiten descartar otras 
razones como causa de sus dificultades de aprendizaje. No sólo estuvo privada de la 
oportunidad de oír hablar o de conversar con otras personas, sino que padecía una grave 
desnutrición, privación social crónica y constantes malos tratos por parte de su padre. No 
sabemos hasta qué punto sus dificultades con el lenguaje reflejan también las consecuencias 
de estos abusos y privaciones adicionales. Por otra parte, tampoco se pudo descartar con 
absoluta certeza la posibilidad de que Genie padeciera alguna discapacidad de nacimiento. 


ÁREAS CEREBRALES IMPLICADAS EN EL LENGUAJE 

Los primeros intentos serios por comprender cómo se representa y organiza el lenguaje en el 
cerebro humano se realizaron durante el siglo XIX. El neurólogo francés Pierre Paul Broca 
(1824-1880) describió en 1861 el caso, ampliamente citado, del paciente Leborgne. Este 
enfermo vivía desde hacía más de 20 años en el hospicio de Bicétre y era conocido como 
Monsieur «Tan», o «Tan-Tan». Parecía comprender todo lo que se le decía y no mostraba 
parálisis alguna que afectara a los músculos bucofonatorios, pero sólo podía decir algo 
parecido a la sílaba «tan», de donde surgió su apodo. Cuando Leborgne murió a la edad de 
51 años, Paul Broca le practicó la autopsia y halló una lesión importante en su cerebro, en el 
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lóbulo frontal del hemisferio izquierdo. Broca presentó sus observaciones a la Sociedad 
Antropológica y concluyó que esta lesión frontal izquierda, en la zona de la tercera 
circunvolución, era el origen de la pérdida de la capacidad de hablar del paciente y que era 
en dicha zona cerebral donde residía la facultad de producir el lenguaje hablado. 

Broca no fue el primero que sugirió un centro del lenguaje en el hemisferio izquierdo, ni el 
primero que observó la lateralización cerebral de la conducta lingúística. Otros estudios 
anteriores por parte de Franz Josef Gall (1758-1828) o Jean Baptiste Bouillaud (1796-1881) 
habían descrito pérdidas de lenguaje después de lesiones cerebrales. Pero Broca no se centró 
en el lenguaje en general, sino en un aspecto o componente particular -la capacidad 
articulatoria-, describiendo por primera vez una localización concreta para ella. Hoy el 
cerebro de Leborgne se conserva en el museo parisino de Dupuytren. Durante los años 
siguientes, Broca presentó otros 19 casos de dificultades del habla como consecuencia de una 
lesión en la tercera circunvolución frontal izquierda. Un siglo y medio después, las 
observaciones de Paul Broca se consideran vigentes en líneas generales, y se reconoce la 
denominada área de Broca como una de las zonas específicamente lingúísticas del cerebro 
humano, cuya lesión da lugar a la afasia motora o afasia de Broca. 

Una década más tarde, el neurólogo alemán de origen polaco Carl Wernicke (1848-1904) 
describió un nuevo tipo de trastorno de lenguaje. En este caso la lesión cerebral se situaba en 
el lóbulo temporal, también izquierdo, en una zona próxima al área auditiva, y el paciente 
presentaba manifestaciones muy distintas a las observadas por Broca. Se trata de la primera 
descripción de la denominada afasia sensorial, o afasia de Wernicke, en la que existen graves 
problemas de compresión y el paciente no entiende lo que se le dice. Si la afasia de Broca se 
caracteriza por un habla lenta y dificultosa, la afasia de Wernicke lo hace por un habla rápida 
y fluida —de ahí que también se la conozca como afasia fluida-, pero vacía de contenido 
semántico porque el paciente tiene problemas para manejar los significados de las palabras. 
En la figura 3-1 se muestra el cerebro humano, desde su lado izquierdo, con las dos áreas 
específicas del lenguaje: área de Broca y área de Wernicke. 

Ambas se hallan conectadas entre sí por millones de 
axones que constituyen la estructura denominada 


Área de Broca 

.* z Fascículo 

5 arqueado 
Ao 


SN fascículo arqueado. 
IN En la tabla 3-2 se resumen las principales diferencias 
A entre los dos cuadros afásicos más conocidos: la afasia 
E de Broca y la afasia de Wernicke. Ambas 
a corresponden a dificultades importantes del lenguaje 
por lesión cerebral en las áreas de Broca y de 
Wernicke, respectivamente. 


Área de Wernicke 


Figura 3-1. Regiones corticales relacionadas con el 
lenguaje: áreas de Broca y de Wernicke. Ambas están 
conectadas a través del fascículo arqueado. 


booksmedicos.org 


Ll 


Psicología del Lenguaje — TEMA 3 


Tabla 3-2. Resumen de los principales rasgos de los dos cuadros afásicos más 


característicos 
Afasia de Broca (motora) 

+ Expresión no fluida (< 50 palabras/min) con considerable esfuerzo, articulada 
pobremente y corta longitud de frase (a menudo una única palabra). Palabras con 
sentido 

+ Agramatismo: lenguaje «telegráfico» (omisión de palabras de función). Uso 
preferente de sustantivos. Dificultad de comprensión gramatical 

+ Notable disprosodia (ritmo y entonación anormales) 

Afasia de Wernicke (fluida o sensorial) 

+ Grave defecto de comprensión (del lenguaje ajeno y propio) 

+ Expresión fluida: muchas palabras, bien articuladas, longitud normal de la frase, 
prosodia normal. Habla vacía: omisión de palabras de contenido 

+  Parafasias (alteración de palabras y fonemas). Neologismos. Repetición recurrente de 
ciertas expresiones 


El afásico de Broca carece de fluidez y habla con dificultad y evidente esfuerzo. Tiene 
problemas en poner en marcha los programas o patrones neuromotores articulatorios de las 
palabras. El control individual de los músculos está preservado y puede imitar gestos con la 
lengua, los labios, etc. El problema reside en la falta de coordinación adecuada para articular 
una palabra completa. Hablar implica el ajuste coordinado de más de un centenar de 
músculos pertenecientes a grupos musculares distintos. Si comparamos la conducta motora 
de hablar con una orquesta de instrumentos musicales, cada uno de ellos funciona bien por 
separado; el problema residiría en las partituras musicales que los coordinan para generar 
una sinfonía. Parece que la zona de Broca es clave para las «partituras» que dirigen y 
coordinan los movimientos del habla. 

Con frecuencia el afásico recurre a estrategias compensadoras, apoyándose en cadenas 
motoras sobreaprendidas. Por ejemplo, ante la pregunta «¿cuántos años tiene tu hijo?», el 
hablante puede seguir la serie «uno, dos, tres, cuatro, cinco, seis, siete», debido a la dificultad 
para pronunciar la respuesta («siete») directamente. Las cadenas verbales sobreaprendidas y 
adquiridas en edades tempranas, como los primeros números, canciones, rezos repetidos, 
etc., son relativamente resistentes al daño cerebral y con frecuencia se hallan preservados. 
Por otra parte, su lenguaje es agramático, carente de morfemas gramaticales importantes, y 
apenas incluye palabras de función, como preposiciones, conjunciones, etc. Su comprensión 
es razonable, pero tiene dificultades para manejar la estructura sintáctica de la frase, por lo 
que frecuentemente no entiende la relación entre las palabras cuando hay cierta complejidad 
estructural. Por ejemplo, presenta problemas con las oraciones compuestas, con la voz pasiva 
o con el orden de las palabras; no entenderá la diferencia entre «Juan insultó a Antonio» y 
«Juan fue insultado por Antonio». 
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El afásico de Wernicke presenta un cuadro casi complementario del de Broca. Tiene fluidez 
y utiliza expresiones con un ritmo y una entonación normales, pero las palabras carecen de 
sentido. Su habla está plagada de neologismos, o palabras nuevas sin significado, así como 
de parafasias o alteraciones y sustituciones de palabras y fonemas. El rasgo más llamativo es 
su enorme dificultad para comprender el lenguaje y manejar el significado de las palabras de 
contenido, como los sustantivos, verbos y adjetivos. Los enfermos presentan una gran des- 
orientación para entender no sólo el lenguaje de los demás, sino también el lenguaje propio, 
con la grave repercusión que esto tiene en su organización del pensamiento. Se trata, en 
general, de un problema más grave y central que el de la afasia de Broca. Mientras que los 
pacientes con afasia de Broca son plenamente conscientes de sus carencias, los de Wernicke 
no siempre son conscientes del trastorno y a veces incluso niegan su existencia. 
El neurólogo Ludwig Lichtheim (1845-1928), que trabajó junto a Wernicke, propuso en 
1885 una clasificación de las afasias, tanto de las observadas hasta ese momento como de 
aquellas posibles, aún no descritas. Este sistema clasificatorio, o modelo de Lichtheim, parte 
de consideraciones neuroanatómicas y plantea un diagrama explicativo que conecta los 
distintos centros del lenguaje. De acuerdo con el lugar de la lesión dentro del diagrama, 
predice un determinado tipo de afasia -en total siete- y las consecuencias comunicativas que 
el daño comporta. Este enfoque se ha convertido en un modelo clásico dentro de la 
neuropsicología, que ha sido desarrollado posteriormente por Norman Geschwind. Su 
aceptación es amplia, si bien algunos autores han sido críticos con el modelo. 
+ El modelo Wernicke-Geschwind 
En su tiempo, Lichtheim y Wernicke plantearon algunos de los principios de la organización 
del lenguaje en el cerebro humano. Observaron que el área de Broca se halla cerca de la parte 
de la corteza motora que controla los movimientos de la mandíbula, la lengua, los labios, 
etc., es decir, los órganos que intervienen en la producción del habla. Por su parte, el área de 
Wernicke está próxima a la corteza auditiva que recibe la información acústica del entorno y 
es Clave en la compresión de las palabras. Plantearon la hipótesis según la cual ambos 
centros del lenguaje debían de estar conectados entre sí. 
Más recientemente, Norman Geschwind (Geschwind 1970), basándose sobre todo en las 
aportaciones de Wernicke, elaboró un modelo que describe cómo fluye la información entre 
Corteza motora las distintas zonas 
pere lo cerebrales al usar el 
: lenguaje (Fig. 3-2). 
Cuando oímos una 
palabra, la información 
- acústica procedente del 
Bo. ¡ mera | oído se proyecta en la 
Área auditiva a, a ld cl fi : : 
de Wernicke a de Wernicke angular corteza auditiva primaria 


A primaria 


arqueado 


de Broca 


Figura 3-2. Modelo de Geschwind sobre el procesamiento del lenguaje en el cerebro. Las flechas azules indican el del lóbulo temporal y, de 
flujo de información neuronal. A) Pronunciación de palabras oídas. B) Pronunciación de palabras escritas. , - 
: d , ésta, pasa al área de 
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Wernicke. Si deseamos pronunciar esa palabra, la información se transmite al área de Broca 
a través del fascículo arqueado, que, como señalamos, es una estructura compuesta por 
millones de axones que conectan las dos áreas del lenguaje: Wernicke y Broca. Finalmente, 
en el área de Broca se activa la información articulatoria y pasa a la corteza motora, desde 
donde se envían las órdenes para el movimiento de los órganos articulatorios. De hecho, el 
área de Broca se sitúa al lado de la corteza motora, justo en la parte en que ésta controla los 
movimientos de la boca, lengua, laringe y otros órganos para generar conductas motoras 
complejas, como la succión, la deglución, la masticación, etc. Probablemente, el área de 
Broca contiene la circuitería adicional que requiere una conducta motora aún más compleja 
como la fonoarticulación del habla. 

Si se trata de la pronunciación de una palabra escrita, la información se proyecta desde la 
retina sobre la corteza visual primaria del lóbulo occipital y, de aquí, pasa al área de 
Wernicke a través de una estructura cortical intermedia que hace de puente: La 
circunvolución angular. En el área de Wernicke probablemente se activa la representación 
auditiva de la palabra, y la información se transmite, igual que antes, al área de Broca a 
través del fascículo arqueado, y de esta área a la corteza motora, para su pronunciación. Una 
lesión en el fascículo arqueado causaría un déficit en la repetición del lenguaje, pero no en su 
comprensión o producción. Es el denominado síndrome de desconexión. 

En líneas generales, el modelo propuesto por Geschwind sigue siendo válido. Nadie duda del 2 5 
predominio del hemisferio izquierdo en las funciones del lenguaje, ni tampoco del 
importante papel que desempeñan el área de Broca, el área de Wernicke, la circunvolución 
angular o el fascículo arqueado. Sin embargo, este modelo es demasiado simple y no recoge 
ni todas las funciones lingúísticas -que son muchas- ni todas las áreas cerebrales que 
intervienen en el lenguaje, que también son muchas. 

El lenguaje humano es mucho más complejo que escuchar y leer palabras. Generalmente no 
escuchamos o leemos palabras aisladas que repetimos o pronunciamos en voz alta sin más. 
Lo normal es que comprendamos el significado de esas palabras, las cuales suelen formar 
parte de alguna oración que tratamos de comprender. A su vez, las oraciones suelen formar 
parte de un discurso más amplio en un contexto determinado, y la comprensión del discurso 
es una actividad muy compleja que requiere la participación de amplias zonas del cerebro, 
incluido el hemisferio derecho. 

Por otra parte, las zonas cerebrales que intervienen en el procesamiento lingúístico son 
muchas más de las que muestra el modelo de Geschwind. Con las modernas técnicas de 
neuroimagen se ha podido comprobar el gran número de áreas que se activan cuando se lleva 
a cabo alguna actividad lingilística y cómo cambian en función de la tarea o de los estímulos. 
Prácticamente todo el hemisferio izquierdo interviene en el procesamiento del lenguaje: área 
prefrontal dorsolalteral, área motora suplementaria, áreas temporales superior, media e 
inferior, zona parietal inferior, circunvoluciones angular y supramarginal. “También 
interviene el hemisferio derecho, especialmente en el procesamiento semántico y en el 
procesamiento del discurso. Además, participan las estructuras subcorticales, tanto los 
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núcleos grises, principalmente el tálamo y los ganglios básales, como la sustancia blanca, en 
concreto las conexiones entre esas zonas de la corteza implicadas en el lenguaje (p. ej., el 
fascículo arqueado) o entre los dos hemisferios (cuerpo calloso) e, incluso, también el 
cerebelo participa en las funciones lingúísticas. 

Tampoco el modelo de Geschwind es tan preciso como se pensaba en la relación entre los 
síndromes clínicos y las zonas cerebrales afectadas. De acuerdo con el modelo cabría 
suponer que las personas con una lesión en el área de Broca tendrían intacta la 
representación mental del lenguaje, y que su problema sería, únicamente, pasar de ésta a su 
realización física o articulatoria. Sin embargo, sabemos que los pacientes con afasia de Broca 
no sólo tienen problemas de producción, sino también dificultades en la comprensión de 
muchas estructuras gramaticales, lo cual no acaba de encajar en el modelo. Dronkers, 
Redfern y Knight (2000) estudiaron una muestra de más 100 pacientes mediante evaluación 
neuropsicológica y neuroimagen y comprobaron que algo más del 16% de los clasificados 
como afásicos de Broca de acuerdo con los resultados neuropsicológicos, no tenían lesión en 
el área de Broca. Por el contrario, sólo el 50-60% de los pacientes con lesión en el área de 
Broca presentaban signos de afasia de Broca. En el caso de la afasia de Wernicke las 
correspondencias eran aun más bajas, puesto que el 35% de los pacientes clasificados como 
afásicos de Wernicke según las pruebas neuropsicológicas, no tenían lesión en dicha área y 
el 65% de los pacientes que sí tenían una lesión en esta área no presentaban los síntomas 
correspondientes a la afasia de Wernicke. En el de las afasias de conducción el desfase era 
aun mayor, ya que la mayoría de los pacientes no tenían una lesión en el fascículo arqueado 
sino en la circunvolución temporal superior izquierda y en la parte inferior del lóbulo parietal 
izquierdo. Por el contrario, lesiones en el fascículo arqueado tenían como resultado graves 
trastornos de producción, ya que los pacientes sólo eran capaces de repetir sílabas o palabras. 
A lo largo de los próximos capítulos se irán rescribiendo las áreas corticales que intervienen 
en Cada uno de los componentes del sistema de procesamiento lingúístico (percepción del 
habla, reconocimiento de palabras, procesamiento semántico, procesamiento sintáctico, etc.), 
ya que los numerosos estudios realizados con las nuevas técnicas de neuroimagen están 
proporcionando abundante información sobre esta cuestión. 

+ Estructuras subcorticales 

Las funciones lingilísticas están asociadas fundamentalmente a la corteza cerebral y, en 
particular, a las áreas de Broca y Wernicke. Sin embargo, en los últimos años se ha ido 
incrementando la evidencia sobre la importancia de las estructuras subcorticales en el 
procesamiento del lenguaje (para una revisión, véase Lieberman, 2000). De hecho, la 
mayoría de los cuadros afásicos corresponden a lesiones cerebrales que no se limitan a un 
daño cortical, sino que afectan también a estructuras subyacentes cuya participación en el 
lenguaje todavía es poco conocida. Parece que los núcleos o ganglios básales forman parte 
de circuitos neurales clave para operaciones de secuenciación, no sólo de conductas motoras, 
sino también de naturaleza sintáctica (Lieberman, Friedman, y Feldman, 1990). Así, las 
personas que padecen la enfermedad de Parkinson, en la que hay un daño degenerativo de 
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algunos núcleos básales, como la sustancia negra y el globo pálido, presentan, además de los 
problemas motores, déficits específicos en el procesamiento sintáctico y gramatical. 

El primer estudio que asoció déficits gramaticales a la enfermedad de Parkinson fue el de 
Nles et al. (1988) de la Universidad de Stanford, quienes hallaron dificultades similares a las 
que presentaban los pacientes con corea de Huntington, enfermedad degenerativa causada 
por la atrofia de otro ganglio basal, en concreto el núcleo caudado. Las frases producidas por 
los enfermos de Parkinson a menudo son cortas y tienen una sintaxis simplificada. Al 
principio se pensó que era una estrategia compensadora frente a los problemas motores 
propios de la enfermedad, pero trabajos posteriores demostraron déficits sintácticos de 
comprensión en tareas basadas en respuestas muy sencillas. Lieberman, Friedman y Feldman 
(1990) presentaron frases de diferente complejidad sintáctica para comprobar el grado de 
comprensión por parte de los enfermos de Parkinson. La respuesta consistía únicamente en 
decir un número (1, 2 o 3) para indicar el dibujo que mejor representaba el significado de 
cada frase. Las frases procedían del Rhode Island Test of Language Structure, un test 
diseñado originalmente para niños sordos y constituido, por lo tanto, de un vocabulario 
sencillo y comprensible para cualquier niño de 6 años de edad. Las frases eran similares en 
cuanto a longitud y otras variables, con excepción de la variable de interés que era la 
complejidad sintáctica. Los resultados mostraron que, de una muestra de 40 enfermos no 
demenciados, 9 tuvieron importantes dificultades de comprensión a causa de la sintaxis, y 2 
todo el grupo en su conjunto cometió un 30% de errores. Por el contrario, los participantes 
neurológicamente sanos del grupo de control apenas cometieron errores en la tarea. Los 
errores de los enfermos de Parkinson tendían a repetirse en el mismo tipo de estructuras de 
modo regular. La mayor proporción ocurría en frases de ramificación izquierda, del tipo 
«como estaba lloviendo, la chica jugaba en la casa», o en frases de relativo con ramificación 
derecha, como «la madre cogió al bebé que estaba llorando» (Recuadro 3-3). 


Recuadro 3-3. Efectos de la falta de oxígeno sobre el lenguaje 


Philip Lieberman estudió las anomalías del lenguaje que se producen en las ascensiones a 
grandes alturas, por escasez de oxígeno o hipoxia, y las relacionó con una afectación 
temporal de los ganglios básales. Este autor dirigió, desde la Universidad de Brown, en 
colaboración con la NASA, un estudio controlado sobre cinco miembros de una expedición 
en el ascenso del monte Everest sin botellas de oxígeno (Lieberman, Kanki y Protopapas, 
1995). En el curso de la ascensión, se les grabó la voz y se les administró una batería de 
tests a diferentes alturas: en el campamento base a 5.300 metros de altura, en el campamento 
dos a 6.300 m y en el campamento tres a 7.150 m. Esta operación la realizaban los 
experimentadores por radio desde el campamento base. También estaba previsto el registro 
de datos en el campamento cuatro a 8.000 m, pero las condiciones meteorológicas lo 
impidieron. 

El análisis de los resultados demostró que se habían operado cambios importantes en la 
secuenciación de los movimientos articulatorios de las consonantes oclusivas. En particular, 
el parámetro VOT (voice onset time; véase el cap. 5) que distingue entre oclusivas sordas y 
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sonoras (/p/ frente a /b/) sufrió una alteración importante con la altura. El tiempo necesario 
para comprender frases sencillas del inglés aumentó de forma espectacular y se relacionó 
positivamente con el deterioro del habla. Los escaladores necesitaban hasta un 50% más de 
tiempo para comprender oraciones que entendería cualquier niño de 6 años. El patrón 
general de dificultades era semejante al que aparece en la enfermedad de Parkinson y, de 
hecho, según observación de los propios expedicionarios, a medida que ascendían sus voces 
se parecían más a las de enfermos parkinsonianos. Para los autores, el cuadro general de 
déficits fue consecuencia del hecho de que la hipoxia afecta selectivamente más a ciertas 
estructuras cerebrales. Estudios histológicos previos han identificado regiones más 
vulnerables a la falta de oxígeno en el hipocampo, el cerebelo y los ganglios básales. 

La exposición a altitudes extremas no parece influir por igual en las distintas funciones 
cognitivas. Por ejemplo, la memoria a largo plazo no resultó afectada en un estudio previo 
en el campamento dos. Esto es congruente con los hallazgos que sugieren que las bases 
neurales de la memoria a largo plazo y el léxico mental son disociables de las que regulan el 
control motor del habla y el procesamiento sintáctico. Estos últimos aspectos están 
preservados, por ejemplo, en la enfermedad de Alzheimer, mientras que la memoria y las 
habilidades léxicas sufren un deterioro. Por el contrario, la memoria y las capacidades 
léxicas se mantienen en los enfermos de Parkinson no demenciados, pero la comprensión 
sintáctica y el habla se ven afectados. Es posible que los trastornos observados en altitudes 
extremas tengan una base neurológica similar, aunque transitoria, a la de los parkinsonianos. 


Otros estudios independientes también han constatado errores similares en tareas de 
comprensión y en juicios sobre la gramaticalidad de las frases en enfermos de Parkinson, en 
particular en el procesamiento de las oraciones pasivas y en la flexión de verbos regulares. 
Todo esto sugiere que ciertas estructuras y circuitos subcorticales podrían desempeñar un 
papel importante en algunos aspectos del lenguaje basados en reglas (Teichmanmn et al., 
2005). 

Como se ha indicado anteriormente, parece que los ganglios básales están involucrados en 
circuitos neurales esenciales para operaciones de secuenciación. Lo llamativo es que su 
acción no se limita a la construcción de secuencias motoras, o «sintaxis» motoras, sino que 
probablemente tienen un papel decisivo en la secuenciación de elementos del lenguaje 
durante el procesamiento sintáctico. Son, por supuesto, estructuras filogenéticamente mucho 
más antiguas que la corteza cerebral. Así, los estudios neurobiológicos en roedores indican 
que estos mamíferos hacen uso de una «sintaxis» regulada por los ganglios básales para en- 
cadenar y secuenciar movimientos individuales dentro de una conducta motora compleja de 
acicalamiento. Las ratas criadas en aislamiento, apartadas de sus congéneres, ejecutan estos 
movimientos en toda su complejidad. Se trata de patrones innatos transmitidos 
genéticamente que, en opinión de Lieberman (2000), formarían parte de una especie de 
«gramática universal de acicalamiento» de las ratas. También hay pruebas electrofisiológicas 
de que los ganglios básales intervienen en patrones complejos de secuencias motoras en 
monos y otros animales. 
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Salvando la distancia evolutiva, hay evidencias del papel secuenciador de los ganglios 
básales en seres humanos y su repercusión sobre el habla y otras funciones. Así, Pickett et al. 
(1998) presentaron el caso de una mujer con una lesión bilateral, limitada a ciertas 
estructuras de los ganglios básales, que mostraba una incapacidad para secuenciar los 
movimientos del habla y, al mismo tiempo, dificultades en la comprensión sintáctica. Su 
habla estaba afectada porque ciertos movimientos se ejecutaban de forma desincronizada 
entre sí: nasalización inadecuada, liberación desincronizada del aire en las consonantes 
oclusivas, descoordinación con los músculos intercostales respiratorios y Otras 
peculiaridades. En la tarea de comprensión de frases, cometía un 14% de errores en la 
distinción de significados según la sintaxis. Sus problemas se centraban en la secuenciación 
de los elementos lingúísticos de la frase, sobre todo en el contraste entre oraciones activas y 
pasivas, y el manejo de cláusulas subordinadas. Sus déficits cognitivos también se 
focalizaban en operaciones mentales que requerían una correcta secuenciación de elementos. 
Por otra parte, no parece casual que el único gen (FOXP2) hallado hasta la fecha 
comprometido en un trastorno probablemente específico del lenguaje interfiera en el correcto 
desarrollo de los ganglios básales, concretamente del núcleo caudado. Como se ha 
mencionado en otro apartado, una mutación de este gen ha causado un grave trastorno 
lingúístico en la mitad de los miembros de una familia inglesa (KE), muy estudiada a lo 
largo de tres generaciones. Los individuos afectados presentan un cociente intelectual 
normal, pero su habla es ininteligible porque sufren un cuadro particular con dispraxia verbal 
y graves dificultades en la secuenciación de los movimientos articulatorios. 

Esta asociación entre circuitos básales y trastornos específicos del lenguaje aparece corrobo- 
rada en estudios de otra índole. Paula Tallal y sus colaboradores (Tallal, Jeringan y Trauner, 
1994) observaron una reducción bilateral del núcleo caudado en un grupo de niños con re- 
traso específico del lenguaje. También informaron de una lesión bilateral en la cabeza del 
núcleo caudado en un niño de 10 años con importantes problemas articulatorios. 


ASIMETRÍA HEMISFÉRICA DEL LENGUAJE 

El cuerpo humano, al igual que en la mayoría de los animales, es simétrico bilateralmente. 
Tenemos dos piernas, dos ojos, dos riñones, dos pulmones, etc., y ambos miembros de cada 
par tienen la misma función. El cerebro también se compone de dos grandes mitades, o 
hemisferios cerebrales, unidos por un conjunto de fibras nerviosas denominado cuerpo 
calloso. ¿También los dos hemisferios realizan la misma función? Parece que en los animales 
sí es éste el caso, al menos en lo que se refiere a la memoria o almacenamiento de la 
información. Algunos trabajos han puesto de manifiesto que las ratas y otros animales 
guardan la misma información en cada mitad del cerebro, proporcionando así una 
redundancia que sería útil en caso de daño en una de ellas. Un modo de investigar esto 
consiste en entrenar al animal en una tarea donde sólo un lado del cerebro recibe la 
información sensorial, y después realizar una prueba en la que participe únicamente el lado 
opuesto del cerebro (para más detalles véase la introducción a las bases neurales de la 
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memoria de Lindsay y Norman, 1986). La situación típica es el aprendizaje de un laberinto 
por parte de una rata mediante múltiples ensayos. Si antes del entrenamiento se practica un 
corte quirúrgico en el quiasma óptico, que es la estructura donde se entrecruza una parte de 
las vías visuales, entonces la mitad izquierda del cerebro recibe información sólo del ojo 
izquierdo, y la derecha sólo del ojo derecho. Con el quiasma seccionado se entrena al animal 
con un ojo tapado y el otro abierto, por ejemplo el derecho. Una vez aprendida la tarea, 
¿conoce la mitad izquierda del cerebro lo que ha aprendido la mitad derecha? La respuesta es 
afirmativa. Cuando se realiza una prueba con los ojos tapados al revés (izquierdo abierto y 
derecho tapado), el animal la ejecuta correctamente. 

Una posibilidad sería que la información se almacenara sólo en un hemisferio cerebral y que, 
en el momento de la prueba, ésta se transfiera al otro hemisferio a través del cuerpo calloso. 
Sin embargo, en nuevos experimentos en los que se seccionó el cuerpo calloso antes de la 
fase final de prueba, la ejecución seguía siendo correcta. Esto quiere decir que en el 
momento del aprendizaje se ha hecho un duplicado de los registros de memoria en ambos 
hemisferios cerebrales, disponiendo de una redundancia informativa que, tal vez, tiene valor 
adaptativo y de supervivencia. 

Es muy probable que esta redundancia sea un lujo que los seres humanos no nos podamos 
permitir, sobre todo para una función tan sumamente compleja como el lenguaje, que 
requiere una extensa circuitería neural. A diferencia de lo que ocurre en otros animales, los 
dos hemisferios del cerebro humano parecen haberse especializado en el tipo de información 
que procesan. En la mayoría de las personas, el hemisferio izquierdo se ha especializado en 
el procesamiento de los símbolos lingiiísticos. Cuando hablamos de centros específicos del 
lenguaje, como el área de Broca o el área de Wernicke, siempre nos estamos refiriendo al 
hemisferio cerebral izquierdo para la mayor parte de la gente. 

Recientemente se ha encontrado cierta asociación entre lateralización manual y habilidad 
verbal. Leask y Crow (2001) analizaron los datos de una muestra de 12.782 individuos, que 
correspondían a todos los nacimientos del Reino Unido durante una semana del mes de 
marzo de 1958. Dentro de un programa nacional, estos individuos habían sido evaluados a la 
edad de 11 años en diferentes aspectos del desarrollo, entre ellos, su lateralidad manual y 
habilidades verbales. La lateralidad se midió comparando el rendimiento de ambas manos en 
una tarea que consistía en marcar el máximo número de cuadrados de una cuadrícula durante 
un minuto. La habilidad verbal se midió con pruebas de vocabulario. Estos autores ob- 
servaron que las personas con una lateralidad más acusada tendían a ser más precoces en la 
adquisición de las palabras. Esta relación se mantenía tanto en el grupo entero como dentro 
de cada grupo de sexo. Un segundo hallazgo fue que las mujeres, como grupo, además de ser 
verbalmente más precoces, estaban más lateralizadas que los varones: las diestras eran «más 
diestras» que los varones diestros. Por otra parte había una proporción menor de zurdas que 
de zurdos. 
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Las fuentes de evidencia a favor de la asimetría cerebral o especialización lingúística del 
hemisferio izquierdo son múltiples y algunas se conocen de antiguo. A continuación 
pasaremos revista a las principales. 

. Lesiones 
Desde hace tiempo se sabe que una herida grave en la cabeza no tiene las mismas 
consecuencias sobre el lenguaje si ésta se produce en un lado u otro de ella. Ya se han citado 
los trabajos pioneros de Paul Broca y Cari Wernicke al realizar estudios post mortem del 
cerebro de pacientes afásicos. Más tarde, las dos guerras mundiales -sobre todo la segunda- 
proporcionaron, desgraciadamente, abundante material de observación. Los soldados 
procedentes del frente con metralla alojada en el lado izquierdo del cerebro solían presentar 
secuelas en el uso del lenguaje, mientras que los que tenían metralla en la parte derecha 
tendían a presentar el lenguaje intacto o poco afectado. Son conocidos los valiosos trabajos 
de Alexander Luria con los combatientes rusos de la Segunda Guerra Mundial, muchos de 
los cuales eran bilingijes, ya que hablaban el ruso y además su lengua nativa, dependiendo 
del origen geográfico dentro de la Unión Soviética. 
Hoy en día se dispone de evidencia clínica continua de los cuadros afásicos producidos por 
lesiones en el hemisferio izquierdo por etiología traumática (sobre todo accidentes de tráfico) 
o cerebrovascular (embolias, hemorragias cerebrales). El cerebro humano es muy exigente 
en el consumo del oxígeno aportado por la sangre. Si una arteria cerebral se obstruye por un 
coágulo o émbolo sanguíneo, se produce un infarto cerebral al interrumpirse la circulación en 
toda la zona irrigada por ella, con la consiguiente muerte masiva de neuronas por anoxia. 
Otra causa vascular es la rotura de un vaso sanguíneo que ocasiona una hemorragia 
intracraneal (conocida también como derrame cerebral). Al no tener ningún espacio libre, ya 
que el cráneo es indeformable, la sangre extravasada comprime y destruye tejidos cerebrales. 
Cuando estos accidentes causan anomalías en el lenguaje, la mayoría de ellos se localizan en 
el hemisferio izquierdo. 

» Test de Wada 
Cuando un neurocirujano tiene que intervenir en el cerebro, por ejemplo, en casos de 
epilepsia grave o en un tumor cerebral, es muy importante que conozca previamente qué 
hemisferio de ese individuo concreto se encarga de las funciones lingúísticas, pues podría 
pertenecer a ese pequeño porcentaje de personas en las que el lenguaje se localiza en el 
hemisferio derecho o en ambos. Es muy distinto intervenir quirúrgicamente en una región 
próxima a estructuras lingúísticas que en ausencia de ellas. En el primer caso, una pequeña 
imprecisión podría tener consecuencias que no se producirían en el segundo. Asimismo, la 
intervención en el hemisferio no lingúístico puede ser más agresiva, es decir, reseccionar una 
área más extensa de tejido para reducir las probabilidades de que se reproduzca el tumor. 
A tal fin, antes de la operación se suele utilizar el denominado test de Wada, en honor a Juhn 
Wada, el neurólogo que en 1949 lo describió por primera vez. Consiste en la introducción en 
la arteria carótida derecha o izquierda, a través de un catéter femoral, de una sustancia 
anestésica (p. ej., amobarbital sódico) que inhabilita durante unos minutos el hemisferio 
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cerebral del mismo lado. En ese breve período se administran pruebas de lenguaje para 
comprobar si éste ha resultado afectado, como contar del 1 al 20, seguir instrucciones 
sencillas como «abre la boca», «cierra los ojos», nombrar objetos comunes (reloj, lápiz), y 
otras. El anestésico causa hemiparesia contralateral, o parálisis de la mitad opuesta del 
cuerpo, y esto sirve para indicar el tiempo de duración de la acción del fármaco. Cada 
hemisferio se somete por separado a dicha inyección con un lapso de, al menos, media hora, 
o bien se realiza en días distintos. Se averigua así cuál de los dos hemisferios se hace cargo 
del lenguaje cuando las tareas lingiiísticas se ven anuladas o entorpecidas. Pruebas 
adicionales indican que otras conductas no resultan afectadas; por ejemplo, con el hemisferio 
lingúístico anestesiado, la persona no puede hablar pero sí cantar sin dificultad. 
El test de Wada es invasivo, y en los últimos años se tiende cada vez más -no sin resistencia 
por parte de muchos neurocirujanos- a utilizar las técnicas de neuroimagen funcional para lo- 
calizar el hemisferio lingúístico. 

+ Cerebro dividido 
Hay cuadros epilépticos tan graves que amenazan la vida de quien los padece. Una solución 
drástica consiste en la sección del cuerpo calloso, que comunica ambos hemisferios, para que 
éstos queden desconectados entre sí; es lo que se conoce como cerebro dividido o split brain. 
Así, se mitigan los efectos más extremos de esas epilepsias y se impide que la «tormenta» 
eléctrica desencadenada en uno de los hemisferios durante un episodio cruce y se extienda al 
resto de cerebro. Por extraño que parezca, las personas con el cerebro dividido pueden llevar 
una vida aparentemente normal. De hecho, algunas personas nacen sin el cuerpo calloso y 
viven muchos años sin problemas con los hemisferios desconectados entre sí. 
Sin embargo, algunos experimentos revelan fenómenos muy interesantes en las personas con 
cerebro dividido. Son célebres los trabajos de Roger Sperry en el Instituto de Tecnología de 
California, por los que recibió el premio Nobel en 1981. Sperry diseñó pruebas en las que los 
estímulos se presentaban a un solo hemisferio cerebral, obteniendo en ocasiones resultados 
sorprendentes. Hay que recordar que las principales vías nerviosas se entrecruzan, por lo que 
cada hemisferio controla y depende de la parte opuesta del cuerpo. Sperry observó que si un 
paciente con los ojos cerrados toca un objeto con su mano derecha (p. ej., unas tijeras), puede 
nombrarlo sin problemas, porque la información táctil viaja directamente al hemisferio 
izquierdo, donde residen los centros del lenguaje. Pero si lo toca con la mano izquierda, es 
incapaz de nombrarlo, porque la información se proyecta al hemisferio derecho y desde aquí 
no puede cruzar al izquierdo para su identificación léxica. No obstante, Sperry constató que 
el objeto como tal sí es identificado: si luego se le pide que lo localice con la mano izquierda 
dentro de una caja con otros objetos, el paciente lo hace correctamente. 
Con la información visual ocurre algo similar. Si se presenta un objeto al hemicampo visual 
derecho mientras se mantiene la mirada en un punto central, el paciente puede indicar el 
nombre del objeto, pero si la presentación se hace en el hemicampo visual izquierdo, es 
incapaz de nombrarlo (Fig. 3-3). 
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Figura 3-3. Paciente con el cerebro dividido (split 
brain). La información de cada hemicampo visual se 
transfiere al hemisferio opuesto a través del quiasma 
óptico, pero luego no puede cruzar al otro lado al es- 
tar seccionado el cuerpo calloso. A) La información del 
objeto no llega a la parte izquierda del cerebro, donde 
reside el lenguaje, y el paciente no puede nombrarlo. 
B) La información del objeto sí llega a la parte izquier- 
da del cerebro y el paciente puede nombrarlo. 


+ Experimentos conductuales 
Múltiples experimentos realizados con personas sanas ponen de manifiesto una asimetría 
hemisférica respecto a muchas tareas de lenguaje. La mayor parte de ellos corresponden a la 
modalidad auditiva y visual. 
Experimentos auditivos 
El paradigma auditivo típico es el conocido como audición o escucha dicótica, propuesto por 
Broadbent en 1954, y que consiste en la presentación simultánea de información distinta a 
cada oído. La autora canadiense Doreen Kimura empleó profusamente esta técnica para 
estudiar las diferencias hemisféricas en el procesamiento de múltiples tipos de estímulos. Un 
experimento típico consiste en la presentación simultánea, mediante auriculares, de parejas 
de sílabas, una distinta a cada oído, por ejemplo, «ba» al oído derecho y «da» al izquierdo, y 
el participante debe indicar qué ha oído. En otra tarea, ésta de memoria, se presenta la serie 
completa de parejas de estímulos y se pide al final que el sujeto indique cuáles recuerda. 
Como cabe imaginar, la variedad de estímulos que se pueden emplear en estas condiciones 
es enorme, tanto de tipo lingúístico como no lingúístico. 
La mayoría de los experimentos que usan material lingúístico muestran una ligera pero 
sistemática ventaja del oído derecho. Hay que tener en cuenta que cada oído envía 
aproximadamente dos tercios de las fibras nerviosas al hemisferio contralateral, y sólo un 
tercio de ellas se queda en el hemisferio del mismo lado, u homolateral. En consecuencia, la 
mayor parte de la información acústica que ingresa en el oído derecho se transfiere al 
hemisferio izquierdo, y viceversa. La ventaja lingiiística del oído derecho se explicaría 
porque la información estimular iría fundamentalmente al hemisferio izquierdo, que es el que 
contiene los centros neurales del lenguaje. 
En general se observa una ventaja del oído derecho en la escucha dicótica de vocales, 
consonantes, sílabas, palabras y dígitos, mientras que el oído izquierdo (hemisferio derecho) 
presenta una ventaja en el reconocimiento de melodías musicales, timbres acústicos y otras 
tareas no lingúísticas, como identificación de emociones o discriminación de intensidades, 
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etc. Hay que señalar que el hemisferio derecho es más eficiente en el procesamiento de la 
prosodia o entonación del lenguaje (Grimshaw et al., 2003). 
Basándose en los resultados obtenidos en la escucha dicótica es posible calcular un índice de 
asimetría: 
índice de asimetría = [(D - DD + D] x100 

donde D es la información presentada al oído derecho correctamente indicada, e I la 
información presentada al oído izquierdo correctamente indicada. El índice de asimetría 
varía entre -100 (ventaja absoluta del oído izquierdo) y +100 (ventaja absoluta del oído 
derecho), siendo O la igualdad entre ambos oídos. En general, la mayoría de las personas 
diestras arrojan un índice de asimetría positivo. Según algunos autores, las mujeres obtienen, 
como promedio, un índice de asimetría ligeramente menor que los hombres, pero no hay 
pruebas concluyentes al respecto. 
Experimentos visuales 
El paradigma típico en el dominio visual lo constituyen los experimentos basados en la 
presentación de estímulos en los hemicampos visuales. En la figura 3-3 se puede apreciar el 
recorrido que siguen las vías visuales desde la retina hasta el cerebro, en su parte posterior u 
occipital. Obsérvese que cualquier estímulo presentado en el hemicampo visual izquierdo, o 
mitad izquierda del campo visual, se proyecta finalmente en el hemisferio derecho. Otro 
tanto sucede con el hemicampo visual derecho al proyectarse íntegramente en el hemisferio 
izquierdo. La condición para que esto suceda es que el individuo mantenga la mirada en el 
punto central de fijación. En esta situación, muchos experimentos consisten en presentar un 
estímulo (p. ej., una palabra) durante un brevísimo período de tiempo en un hemicampo u 
otro, de forma aleatoria, para que el individuo lo identifique. Se trata de comparar el 
rendimiento ante los estímulos mostrados en un hemicampo frente a los presentados en el 
otro. 
Los datos indican que todo el material verbal, como palabras, sílabas, letras, etc., se 
identifica mejor cuando se presenta al hemicampo visual derecho (hemisferio izquierdo). Sin 
embargo el hemicampo izquierdo (hemisferio derecho) es superior en el reconocimiento de 
formas, localización de puntos y otras tareas visuales no verbales (véase una revisión en 
Springer y Deutsch, 1993). También parece que el hemisferio derecho es más eficiente en el 
reconocimiento de rostros humanos, lo que concuerda con el hecho de que la prosopagnosia, 
o trastorno de identificación de las caras familiares, aparece como consecuencia del daño 
cerebral en determinadas zonas del hemisferio derecho. Para las personas que padecen esta 
rara afección, la diferenciación de dos rostros humanos requiere el mismo esfuerzo analítico 
que la diferenciación entre dos rocas (véase el punto de vista de una paciente en su 
interesante página web: http:// www.prosopagnosia.com/). 

* Activación del cerebro observada con técnicas de neuroimagen 
La quinta fuente de evidencia a favor de la asimetría hemisférica del lenguaje procede de las 
técnicas de neuroimagen. Gracias a ellas es posible observar qué áreas cerebrales se activan 
mientras se realiza una tarea. Cuando la tarea es lingiiística, la mayoría de las personas 
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presentan mayor activación en el hemisferio izquierdo. Estas técnicas se describirán en 
detalle más adelante. 

En la mayoría de las personas, el hemisferio izquierdo del cerebro se ha especializado en las 
funciones del lenguaje. Esto guarda relación estadística con la dominancia manual: mientras 
que en el 98 %, aproximadamente, de los diestros el lenguaje se localiza en el hemisferio 
izquierdo, este porcentaje disminuye al 70 % en los zurdos según diferentes estudios. ¿Por 
qué es el hemisferio izquierdo el que se encarga principalmente del lenguaje en casi todos los 
seres humanos? Puede entenderse que esta complejísima función, muy exigente en circuitos 
neurales, no esté duplicada en ambos hemisferios, ya que, como ya señalamos, sería un lujo 
que el cerebro humano no puede permitirse; sin embargo, ¿por qué en la parte izquierda? En 
fin de cuentas, el lenguaje podría estar lateralizado en la parte derecha o en la izquierda, en el 
50% de las personas. Algunos autores consideran que, tal vez, el hemisferio izquierdo posee 
una ligera ventaja inicial de desarrollo sobre el derecho en casi todos los individuos, lo que 
explica que también haya muchos más diestros que zurdos. Cuando el habla hace su 
aparición en el desarrollo infantil, el hemisferio izquierdo está mejor preparado para asumir 
ese control y, de alguna forma, «captura» la función. Una vez lateralizada el habla, parece 
lógico que le sigan los procesos más centrales de comprensión y representación simbólica 
del lenguaje. Esta explicación es atractiva, pero simplemente desplaza la pregunta: ¿por qué 
sería precisamente la parte izquierda la que tendría esa ventaja inicial? 

¿Qué sucede en los animales? ¿También hay diestros y zurdos? La respuesta es negativa en 
líneas generales. En algunos animales se han observado preferencias motrices de una parte 
del cuerpo para ciertas tareas (giro corporal, apretar una palanca, etc.), pero parece que 
dependen de contingencias ambientales y no es la misma preferencia para todos los 
individuos de una especie. 

Un caso aparte, muy interesante por su paralelismo con el habla humana, es el de las aves 
canoras. El canto de los pájaros también está funcionalmente lateralizado y depende de 
centros neurales localizados sobre todo en uno de los dos hemisferios. Nottebohm (1977) 
observó que la sección del nervio hipogloso izquierdo en canarios hacía que éstos dejaran de 
cantar, mientras que la sección del nervio derecho no afectaba al canto. También la lesión de 
ciertos núcleos cerebrales izquierdos inhibían el canto en mayor medida que la lesión de 
estructuras homologas de la parte derecha. En el desarrollo de este tipo de asimetría se han 
buscado implicaciones neurohormonales, porque parece que el control del canto en el 
canario macho es dependiente de la testosterona. La siringe izquierda, órgano generador del 
canto, es más pesada y tiene mayor contenido de ciertos componentes bioquímicos que la 
siringe derecha, pero esta diferencia desaparece en los canarios castrados y, a su vez, puede 
ser inducida por administración de testosterona en canarios hembra. 

Por lo que se refiere a los seres humanos, se han propuesto diversas teorías sobre la 
especialización hemisférica del lenguaje, pero ninguna de ellas da todavía una respuesta 
definitiva a la cuestión. Algunas hacen hincapié en factores genéticos y su relación con la 
dominancia manual; otras, en factores hormonales como la testosterona, o en diferencias 
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anatómicas entre los hemisferios y en cómo éstos han ido evolucionando en el interior del 
cráneo. 


METODOLOGÍAS DE INVESTIGACIÓN 
En el pasado, la única forma de observar anomalías en el cerebro que pudieran ser causa de 
trastornos lingúísticos era mediante su estudio post mortem, como hicieron Broca, Wernicke 
y otros autores. Los estudios basados en lesiones son valiosos, pero tienen importantes 
limitaciones. Las causas del daño cerebral, sean traumáticas, vasculares, infecciosas oO 
degenerativas, son de naturaleza incontrolada y accidental. Con frecuencia afectan a 
múltiples estructuras adyacentes o superpuestas, siendo cada lesión un caso en sí misma. Por 
otra parte, sus efectos suelen atribuirse a la zona local dañada, pero las lesiones también 
destruyen sustancia blanca, o vías de conexión, y parte de su sintomatología puede ser 
resultado de la desconexión de estructuras cerebrales distantes, remotas al lugar de la lesión. 
Hoy los neurocientíficos disponen de medios para estudiar las estructuras cerebrales también 
en individuos neurológicamente intactos. El primer avance significativo se produjo con la 
aplicación de los rayos X y su posterior implementación gracias a las técnicas de tomografía 
computarizada (TC), que han permitido pasar de una imagen plana a un modelo tridimensio- 
nal del cerebro. 
Además de estudiar la estructura del cerebro en reposo, interesa sobre todo conocer las áreas 
que se activan durante el desempeño de una función mental. En los últimos veinte años 
hemos asistido a una verdadera explosión en el uso de las tecnologías de electrofisiología 
cerebral y de neuroimagen en la investigación de las funciones del cerebro humano. Permiten 
investigar la actividad neural que subyace a la realización de los procesos mentales, aunque 
tienen características distintas. Así, la técnica de los potenciales evocados, o potenciales 
relacionados con eventos (event related potential, ERP), y la magnetoencefalografía tienen 
una gran resolución temporal (del orden de milisegundos) y detectan cambios rápidos de 
actividad bioeléctrica o magnética, respectivamente, tras la presentación de un estímulo. Pero 
su resolución espacial es limitada y no permiten un gran detalle topográfico. Por el contrario, 
las técnicas de neuroimagen (tomografía por emisión de positrones y resonancia magnética 
funcional) ofrecen una resolución espacial excelente, pero escasa precisión temporal. Ambas 
detectan cambios del flujo sanguíneo asociados a las zonas cerebrales más activas durante un 
proceso mental determinado, y estos cambios se demoran durante segundos. 

+ Potenciales evocados 
Esta técnica utiliza pequeños electrodos colocados sobre el cuero cabelludo para detectar la 
actividad bioeléctrica del cerebro. En realidad, la señal registrada es la del 
electroencefalograma clásico o EEG, pero tratada mediante procedimientos informáticos 
para extraer de ella el potencial relacionado con la presentación de un estímulo o ERP. El 
EEG es el registro de una actividad eléctrica rítmica que resulta de la suma de cientos de 
millones de microprocesos neurales que se producen simultáneamente en todo el cerebro. La 
presentación de un estímulo, sea visual o auditivo, provoca cambios débiles en el registro 
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eléctrico que normalmente no son visibles directamente porque quedan subsumidos dentro la 
incesante actividad rítmica u oscilatoria del EEG. A través de procedimientos matemáticos 
computarizados, que filtran y promedian la señal de múltiples registros correspondientes a 
estímulos análogos, se eliminan los componentes rítmicos del EEG y se extrae la onda 
subyacente, mucho más débil, que está relacionada con la presentación del estímulo. Esta 
onda o señal es propiamente el potencial evocado por el estímulo y es un reflejo, aunque 
imperfecto, de los procesos cerebrales causados por dicho estímulo. 

Por lo general, para el registro del EEG y su posterior análisis de potenciales evocados (ERP) 
se utilizan varios electrodos situados en zonas específicas de la cabeza (32, 64 ó 128 
electrodos son números habituales); cada uno de estos electrodos registra una actividad 
bioeléctrica algo diferente, permitiendo disociar, aunque no localizar, redes neurales 
subyacentes. El cráneo, al interponerse entre el cerebro y los electrodos, hace de elemento 
difusor de la actividad eléctrica, por lo que la imagen global de los potenciales evocados de 
toda la cabeza resulta muy difuminada, con poca resolución espacial y sin detalles 
topográficos. Por el contrario, la resolución temporal es excelente, ya que es posible seguir al 
milisegundo la forma de la onda desde la aparición del estímulo. Es decir, los potenciales 
evocados no son una técnica de imagen del cerebro, sino una medida fisiológica de su 
actividad bioeléctrica. 

Una de las respuestas evocadas más robustas es el denominado componente P300 o pico 
positivo que suele aparecer a los 300 ms de la presentación de un estímulo cualquiera, lin- 
gúístico o no (p. ej., una palabra o la imagen de un objeto). Representa el procesamiento 
consciente del estímulo y es más intenso cuanto más impredecible es éste. 

En relación con el lenguaje, un componente muy estudiado, que guarda relación con el pro- 
cesamiento semántico, es el N400, descubierto por Kutas y Hillard (1980) (Fig. 3-4). 
Consiste en un «valle», o deflexión negativa de la onda 
cerebral, que surge en torno a los 400 ms tras la 
administración del estímulo. La situación típica consiste 
en la presentación de una frase cuya última palabra es 
anómala desde el punto de vista semántico. Por 
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ejemplo, si se compara la respuesta bioeléctrica ante la 
frase normal «La pizza estaba demasiado caliente para 
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AS ser comida» con la respuesta ante la frase anómala «La 


ESOO pizza estaba demasiado caliente para ser bebida», el 


Figura 3-4. Potencial evocado N400 al presentar un N400 surgiría alrededor de unos 400 ms tras la 
estimulo semánticamente anómalo (puntos), en com- ., . 
paración con un estímulo congruente con el contexto Presentación de la palabra «bebida». 
de una frase (linea). Obsérvese que los valores negati- : .z 
ie eanin en la párte supeñor El N400 refleja procesos centrales de comprensión y es 
independiente de la modalidad sensorial del estímulo, 
sea visual O auditiva. Está presente incluso ante el lenguaje de los signos para personas 


sordas. Se puede usar para estudiar el grado de comprensión en personas afásicas. 
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+. Magnetoencefalografía 

Una técnica cada vez más usada es la magnetoencefalografía (MEG) o registro de los 
campos magnéticos producidos por la actividad cerebral, a través de unos dispositivos 
extraordinariamente sensibles. Estos campos magnéticos cerebrales son tan débiles que su 
registro debe realizarse en cámaras especiales aisladas del campo magnético terrestre. Los 
microcampos magnéticos se derivan directamente de las corrientes iónicas generadas en las 
dendritas de las neuronas durante las transmisiones sinápticas. Un único campo es tan débil 
que no es detectable por sí mismo, pero sí lo es el que surge de varios cientos de millones de 
neuronas activas a la vez. Como descubrió Michael Faraday en el siglo XIX y luego 
desarrolló Maxwell en sus ecuaciones, la electricidad y el magnetismo son dos fenómenos 
físicos estrechamente relacionados: allí donde hay una corriente eléctrica entre dos polos, se 
genera un campo magnético perpendicular a dicha corriente. Lo mismo ocurre en el cerebro: 
las descargas eléctricas de las neuronas registradas mediante el EEG generan campos 
magnéticos perpendiculares. Dada la anatomía cerebral, el EEG y la MEG proporcionan 
información sobre la actividad de grupos de neuronas diferentes. Mientras que el EEG 
registra la actividad bioeléctrica de grupos de neuronas perpendiculares al cráneo, es decir 
situadas en la superficie de la corteza, la MEG registra los campos magnéticos de grupos de 
neuronas tangenciales al cráneo, localizadas en los surcos cerebrales. 

En realidad la MEG es conocida desde la década de 1970, pero su desarrollo sólo fue posible 
más tarde gracias a los avances en computación y microelectrónica. Tiene buena resolución 
temporal (inferior a 1 ms) y constituye una buena medida del curso temporal de 
determinados procesos mentales. Su precisión espacial es mejor que la de los potenciales 
evocados. En clínica se usa cada vez más para localizar los focos irritativos de pacientes 
epilépticos o la ubicación exacta de los centros de lenguaje en un individuo antes de una 
intervención quirúrgica. No obstante, hoy por hoy, la MEG presenta aún dificultades técnicas 
y metodológicas, sin contar su elevadísimo coste, que hacen que no sea la mejor técnica de 
exploración en muchas funciones mentales y deba complementarse con otras. 

*- Tomografía por emisión de positrones 

El cerebro es un órgano muy exigente en oxígeno y nutrientes aportados por la sangre. 
Aunque su peso representa aproximadamente el 2% del organismo, recibe el 20% del flujo 
sanguíneo que sale del corazón. La distribución de la sangre es desigual en su interior: la 
sustancia gris, formada por los cuerpos celulares de las neuronas, recibe el triple que la 
sustancia blanca, o conjunto de conexiones que conducen el impulso nervioso. 

La técnica de neuroimagen denominada tomografía por emisión de positrones (PET) se 
aprovecha del flujo sanguíneo para ofrecer una imagen de la actividad cerebral en un 
momento determinado. Previamente se inyecta un marcador radiactivo en la sangre que se 
mezcla con la glucosa contenida en ella. El marcador emite positrones que pueden ser 
detectados mediante un dispositivo especial, y la mayor densidad de radiación muestra las 
zonas cerebrales más activas, es decir, las que consumen más glucosa durante el transcurso 
de un proceso mental determinado. Un ordenador codifica en colores los distintos grados de 
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actividad y ofrece una imagen relativamente detallada de la actividad de cada parte del 
cerebro. 
La PET requiere un equipo voluminoso y muy costoso, casi siempre disponible en insti- 
tuciones hospitalarias para uso clínico. Generalmente, a través de acuerdos con equipos y 
centros de investigación, se destina parte del tiempo del instrumental a la actividad investi- 
gadora. Uno de los grupos pioneros en la aplicación de PET al estudio de procesos psicológi- 
cos ha sido el liderado por Michael Posner en la Universidad de Oregón. 
En el campo de los procesos del lenguaje, la PET se ha aplicado en multitud de trabajos. En 
su influyente libro, Posner y Raichle (1994) presentan experimentos que demuestran que en 
una tarea lingiística se activan distintas zonas de la corteza, dependiendo de la naturaleza de 
dicha tarea. La visión pasiva de palabras activa áreas occipitales y parietales próximas a las 
estructuras que procesan la información visual. La audición de palabras activa la corteza 
auditiva en el lóbulo temporal y el área de Wernicke. La pronunciación de palabras activa el 
área de Broca, mientras que la generación de verbos activa las áreas de Broca y de Wernicke. 
Esta tarea consiste en la presentación de un sustantivo o un dibujo ante el cual el participante 
debe generar un verbo relacionado con el estímulo (p. ej., ante «pluma», «escribir»). Esto se 
hace mentalmente o de forma verbal, dependiendo del experimento. 
Hay otras técnicas de imagen de detección radiactiva, como la tomografía computarizada por 
emisión de fotón único o SPECT. Esta técnica proporciona también información sobre el 
flujo sanguíneo cerebral, gracias a un marcador radiactivo emisor de rayos gamma que se 
inyecta en la sangre. 

+ Resonancia magnética funcional 
A pesar de sus valiosas posibilidades, la PET es una técnica ciertamente invasiva que requie- 
re la inyección de una sustancia radiactiva en el cuerpo. Aunque la dosis total de 
radiactividad es relativamente baja, en los últimos años se han intensificado las críticas hacia 
su uso, especialmente desde que ha entrado en escena una nueva técnica de neuroimagen 
menos invasiva: la resonancia magnética funcional (RMf). Esta se basa en la técnica de 
resonancia magnética convencional (Recuadro 3-4) empleada en los hospitales para la 
obtención de imágenes detalladas de la anatomía interna de las distintas partes del cuerpo, 
pero va más allá pues, como su nombre indica, proporciona información sobre la actividad 
cerebral que acompaña a las funciones psíquicas. 


Recuadro 3-4. Resonancia magnética convencional 


La resonancia magnética convencional, o estructural, se fundamenta en las propiedades 
magnéticas del átomo del hidrógeno. Este elemento se encuentra sobre todo en el agua, la 
sustancia más abundante del cuerpo. Mediante un fuerte campo magnético externo se obliga 
artificialmente a que los campos magnéticos de los átomos de hidrógeno se alineen en la 
misma dirección. A continuación, con breves impulsos de radiofrecuencia se suspende 
temporalmente el campo externo y los átomos vuelven a su orientación magnética original. 
La vuelta a la orientación original genera una señal que va a depender de la densidad de los 
átomos de hidrógeno o, en otras palabras, de la distinta proporción de agua que contienen 
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los tejidos anatómicos. Esto permite observar las distintas estructuras histológicas con un 
nivel de detalle desconocido hasta ahora. Son las «resonancias» habituales que hoy se 
practican en cualquier hospital con diversos fines diagnósticos: desde la detección de un 
tumor cerebral hasta la rotura de ligamentos en una rodilla. La resonancia magnética es un 
ejemplo de una poderosa técnica aplicada que se derivó inesperadamente de la investigación 
básica con los gigantescos aceleradores de partículas, en la física de las altas energías. 
Probablemente, sin la investigación básica nunca se hubiera dado con esta técnica que tantos 
servicios aplicados ofrece. 


Se basa en las propiedades magnéticas de la hemoglobina, el componente de la sangre que 
transporta el oxígeno. La sangre tiene propiedades magnéticas distintas cuando lleva oxígeno 
(oxihemoglobina), que cuando no lo lleva (desoxihemoglobina). Si la afluencia de sangre 
hacia una región del cerebro es mayor durante una determinada operación mental, aumenta 
en esa región la proporción de moléculas de hemoglobina cargadas de oxígeno. De hecho, el 
ritmo en que el tejido cerebral consume el oxígeno es sobrepasado notablemente por el de su 
afluencia, por lo que las zonas funcionalmente activas experimentan un estado permanente 
de sobreoxigenación y, en consecuencia, su tasa de desoxihemoglobina es inferior al de las 
zonas no activas. Esto tiene consecuencias en la distribución de los campos magnéticos 
(Howseman y Botwell, 1999; Fiez, 2001). 

El estudio de una función o subproceso específico requiere siempre la comparación entre, al 40 
menos, dos tipos de imágenes, las obtenidas mientras se realiza la función y las obtenidas en 
ausencia de dicha función, que sirven de línea base. La diferencia entre ambas indicará las 
áreas cerebrales que han intervenido durante la función. En algunos experimentos, la línea 
base se obtiene mientras el sujeto está simplemente en reposo; en otros, el participante 
realiza una tarea que sirve de comparación con la que se quiere estudiar. 

Los diseños experimentales con RMf son cada vez más sofisticados y se concede mayor 
importancia a la línea base. De hecho, ningún proceso o subproceso que se pretenda estudiar 
ocurrirá de forma pura y aislada, sino que formará parte de una tarea más compleja que 
inevitablemente incluirá otros subprocesos que no son objeto de nuestro interés. De acuerdo 
con el principio de sustracción, lo importante es conseguir una tarea base que sea 
exactamente igual a la experimental, salvo en el subproceso que se pretende estudiar. De ahí, 
la importancia de escoger una tarea apropiada para la línea base. En ciertos diseños, es 
posible mantener la misma tarea para las dos condiciones, y lo que se cambia es el tipo de 
estímulos. 

Aunque en la RMf no se inyecta ninguna sustancia radiactiva, como en la técnica PET, no 
está exenta de limitaciones. En primer lugar, la señal debe registrarse en condiciones de 
inmovilidad casi absoluta de la cabeza, lo cual excluye o dificulta tareas en las que el sujeto 
deba dar una respuesta vocal. Se recurre, sobre todo, a tareas encubiertas, de respuesta 
mental silenciosa, o bien de respuesta motora a través de los dedos sobre una caja especial de 
respuestas. Las imágenes dependientes de los cambios del flujo sanguíneo tardan segundos 
en crearse, razón por la cual la resolución temporal es baja y no permite el seguimiento 
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exacto del curso temporal de los procesos. Por otra parte, la relación señal-ruido en una 
imagen individual es pobre, lo que obliga a promediar muchas imágenes tomadas en las 
mismas condiciones. El equipo utilizado produce un ruido intenso que resulta problemático 
para algunos experimentos con estímulos sonoros. Asimismo, el fuerte campo magnético 
externo impide su aplicación -y sería altamente peligroso- en personas con marcapasos en el 
corazón O prótesis metálicas. Pese a estos inconvenientes, la RMf ofrece una buena 
resolución espacial y constituye hoy la técnica de neuroimagen funcional preferida. 

En resumen, gracias a las técnicas electro-fisiológicas y de neuroimagen, en los últimos años 
se ha generado un volumen importante de datos que ayuda a conocer mejor el soporte neural 
de subprocesos cada vez más específicos. Sirva de muestra algunos ejemplos. Hoy sabemos 
que una zona particular del hemisferio izquierdo, de aproximadamente 1 cm/, es clave para 
la articulación del habla. También sabemos que las palabras tienen una representación 
cerebral distinta dependiendo de su categoría gramatical. Diversos trabajos con PET y RMf 
revelan que los nombres y los verbos activan zonas distintas del cerebro: mientras que los 
verbos activan áreas más anteriores -regiones prefrontales y frontotemporales—, los nombres 
activan zonas más posteriores -áreas occipitotemporales- incluida la corteza visual. Esto 
concuerda con los estudios basados en pacientes lesionados. 


RESUMEN 

+ El lenguaje humano tiene una naturaleza más biológica que cultural y hay varios 
datos que apoyan esta concepción biologista del lenguaje: adquisición espontánea y 
temprana, pobreza del estímulo, existencia de lenguaje en todas las comunidades, 
principios universales en todas las lenguas y aparición de las lenguas criollas. 

» Una cuestión muy debatida durante años es el papel de la herencia y el ambiente en el 
desarrollo del lenguaje o, en otras palabras, el carácter innato del lenguaje. Los 
estudios genéticos sugieren la posibilidad de que sean varios los genes responsables 
del lenguaje, aunque uno de ellos, el FOXP2, parece desempeñar un papel 
especialmente relevante. No obstante, el ambiente es también determinante y el 
resultado final, el fenotipo, es el resultado de la interacción de ambos factores. 

+ El estudio científico de las bases neurológicas del lenguaje comenzó en la segunda 
mitad del siglo XIX, cuando el médico francés Broca describió varios pacientes con 
trastornos en el habla que tenían una lesión en la parte inferior del lóbulo frontal 
izquierdo. Poco después, Wernicke describió el trastornos opuesto, es decir, pacientes 
con trastornos en la comprensión oral que tenían dañada la parte posterior y superior 
del temporal izquierdo. 

+ Por esa época, Lichtheim propuso un modelo neurológico del lenguaje, que incluía un 
centro auditivo para el reconocimiento del habla (área de Wernicke), un centro motor 
para la producción (área de Broca) y una conexión entre ambos centros a través del 
fascículo arqueado. Casi cien años después Geschwind, en la década de 1960, retomó 
ese modelo y lo amplió, constituyendo el modelo de referencia sobre las bases 
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neurológicas del lenguaje durante décadas. 

+ En los últimos años, sin embargo, con el desarrollo de las técnicas de neuroimagen, se 
ha comprobado que son muchas más las áreas cerebrales que intervienen en el 
lenguaje que las que propone el modelo de Geschwind. No sólo hay muchas otras 
zonas de la corteza que también intervienen, incluido el hemisferio derecho, sino que 
además están los núcleos y tractos sub-corticales que son fundamentales y cuya lesión 
produce graves trastornos afásicos. Sí parece evidente que el hemisferio izquierdo es, 
en la mayoría de las personas, el responsable del procesamiento lingúístico. 


Preguntas de reflexión 

+ ¿Por qué el modelo de Wermicke-Geschwind no es capaz de explicar de manera 
completa la relación cerebro-lenguaje? 

+ ¿Qué estructuras subcorticales desempeñan un papel importante en el procesamiento 
del lenguaje? 

+ ¿Existen realmente períodos críticos para el desarrollo del lenguaje? 

+ ¿Qué ventajas tiene la resonancia magnética funcional sobre la tomografía por emisión 
de positrones? 
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LENGUAJE Y PENSAMIENTO 


Objetivos de aprendizaje 
Al finalizar el capítulo el alumno será capaz de: 
e Conocer los antecedentes históricos de la relatividad lingúística. 
e Conocer el debate clásico entre Piaget y Vigotsky sobre el significado del lenguaje 
egocéntrico. 
e Entender la hipótesis de la relatividad lingúística y sus implicaciones. 
e Valorar las pruebas empíricas a favor y en contra de la relatividad lingúística. 
e Conocer cómo el desarrollo de algunos conceptos precede al lenguaje. 
e Conocer el carácter conceptual y prelingiístico de algunas metáforas. 


INTRODUCCIÓN 

A poco que se reflexione sobre la cognición humana llaman la atención dos aspectos que nos 
definen como especie: el lenguaje y el pensamiento. Como ya se ha mencionado en el capítulo 
2, la complejidad formal del lenguaje humano, su capacidad combinatoria y su referencialidad 
ilimitada no tienen parangón en el reino animal. Por su parte, el pensamiento humano nos 
permite categorizar o clasificar objetos, acciones, eventos y características del mundo con una 
articulación y un detalle únicos. Además, podemos establecer relaciones causales entre 
eventos remotos, evocar el pasado, planificar nuestra conducta hacia metas lejanas, razonar 
sobre posibilidades o hipótesis, crear y utilizar artefactos materiales y sociales extraor- 
dinariamente complejos e ingeniosos, etcétera. 

Todo esto nos lleva a una pregunta fundamental en la psicología, y anteriormente en la 
filosofía, que aún hoy sigue abierta: ¿cuáles son las relaciones funcionales entre el 
pensamiento y el lenguaje? Esta cuestión ha intrigado a los seres humanos, por lo menos desde 
la Grecia clásica. Una respuesta frecuente es que el lenguaje es necesario, al menos en cierta 
medida, para el pensamiento; en su forma más radical, esta postura asegura que es imposible el 
pensamiento sin lenguaje, e incluso se llega a identificar el pensamiento con el lenguaje. Para 
Platón, por ejemplo, el pensamiento era el diálogo del alma consigo misma, de manera que, en 
cierto modo, pensamiento y lenguaje eran considerados idénticos. 

En el siglo XVIII, el lingiista y naturalista Von Humboldt concebía el lenguaje como «órgano 
formador del pensamiento», frente a la concepción del lenguaje como mero instrumento 
reproductor de la realidad. Por otra parte, una respuesta con menos adeptos, pero que merece 
seria consideración, es que el pensamiento es independiente del lenguaje e, incluso, que es 
prioritario, siendo el lenguaje un mero producto derivado de aquél. Por ejemplo, William 
James en The principies of psychology, de 1890, expone su intuición de que ciertas activi- 
dades del pensamiento pueden ser independientes del lenguaje y que es posible un 
pensamiento no verbal sustentado en símbolos no verbales, como las imágenes visuales. 

Si acudimos a nuestra intuición, parece haber motivo para darles la razón a ambas posturas. 
Cuando pensamos en silencio (p. ej., al resolver un problema o al tomar una decisión), las 
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palabras acuden a la mente como una especie de «habla interna» entrecortada y poco 
gramatical que parece dar forma a nuestros pensamientos («uhm... qué hago... presento los 
papeles del Erasmus... es poco dinero... quizá trabajo antes...»). Pero también podemos tener la 
experiencia de pensar en forma de imágenes visuales, motoras, auditivas y hasta emocionales. 
Podemos pensar, por ejemplo, en una escena deportiva, apoyándonos únicamente en imágenes 
visuales, sin participación del lenguaje. 

Por razones un tanto doctrinales, el conductismo en las primeras décadas del siglo XX se 
apuntó a la tesis radical de que el pensamiento se reduce al habla. El conductismo supuso una 
fuerte reacción contra el introspeccionismo y reivindicó para la psicología el mismo grado de 
objetividad que el de las ciencias naturales y experimentales. Esto desplazó el objeto de estu- 
dio hacia sólo aquello que podía ser observado y medido directamente: la conducta, 
rechazando, o relegando a un segundo plano, los procesos mentales, por ser opacos a la 
observación. En este contexto, al pensamiento, como proceso no observable de forma directa, 
se lo consideró un fenómeno carente de interés científico y se lo igualó al lenguaje o habla 
subvocal. La idea fue desarrollada por el propio Watson (1920), fundador del conductismo. 
Según él, el lenguaje no era más que un conjunto de hábitos motores de la laringe y la lengua, 
y el pensamiento consistía simplemente en lenguaje silencioso, antes de materializarse en 
sonido, o sea, un lenguaje subvocal. Algunas observaciones irían en esa línea. Los niños 
pequeños expresan sus pensamientos en voz alta, como veremos en el próximo apartado; a 
medida que crecen, esta expresión se va internalizando hasta que ya no es audible, 
constituyendo el pensamiento o habla interna subvocal. En el otro extremo de la vida, muchos 
ancianos piensan en voz alta y necesitan que esa «habla interna» se materialice externamente. 
Los malos lectores precisan leer en voz alta para comprender lo leído; a medida que adquieren 
pericia lectora, leen en voz más baja hasta que finalmente sólo mueven los labios 
silenciosamente; los buenos lectores ya sólo «hablan» internamente con el pensamiento. 

Este enfoque del habla subvocal tuvo el mérito de alentar cierto número de estudios empíricos, 
como los trabajos de Agnes Thorson de la Universidad de Minnesota (Thorson, 1925), en los 
que se medían los movimientos de la lengua mientras los sujetos tenían pensamientos 
verbales. Jacobson (1932) comprobó que el pensamiento se acompaña con frecuencia de habla 
encubierta, al detectar actividad eléctrica en los músculos de la garganta de los participantes 
cuando se les pedía que pensaran en algo determinado. Este tipo de estudios tendrían 
continuación más tarde en los análisis electromiográficos de los fenómenos verbales 
encubiertos. 

¿Quiere esto decir que el pensamiento no puede existir sin el lenguaje o el habla? Ahora 
podemos contestar categóricamente que no es así. Hay múltiples evidencias que nos indican 
que es posible pensar sin la participación del lenguaje (Steinberg, 1993). 

Es posible pensar sólo con imágenes. Nuestra experiencia nos indica que es posible pensar, 
por ejemplo, en una escena deportiva, apoyándose únicamente en imágenes visuales, sin 
participación del lenguaje. 
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Es posible pensar con los músculos paralizados. En un experimento realizado en los años 
cuarenta, que hoy sería cuestionable desde el punto de vista ético, un equipo de anestesiólogos 
de la Universidad de Utah (Smith et al., 1947) demostraron que es posible pensar y resolver 
problemas mentalmente mientras se sufre una parálisis completa de los músculos del cuerpo. 
Aunque el propósito principal era estudiar las aplicaciones quirúrgicas de un derivado del 
curare (en concreto, d-tubocurarina), sus resultados tuvieron importantes implicaciones 
teóricas y ha sido un trabajo ampliamente citado en la literatura psicolingúística. A riesgo de 
su vida, el primer autor, Scott M. Smith, se sometió voluntariamente a una inyección intra- 
venosa del derivado curárico para observar en sí mismo las distintas fases de la parálisis 
muscular y sus efectos sobre la conciencia. El curaré paraliza toda actividad muscular del 
cuerpo, excepto la cardíaca y la del sistema digestivo, por lo que son necesarias la intubación y 
la respiración asistida para evitar la muerte. Cuando el efecto paralizante alcanza su máximo, 
es imposible toda respuesta motora voluntaria, por nimia que sea (un movimiento de ojos, un 
parpadeo, etc.). Una vez que los efectos decrecieron, Smith informó de que en ningún 
momento había perdido la conciencia ni la capacidad de pensar. Esto pudo confirmarse al re- 
cordar Smith los distintos estímulos que el resto del equipo le había ido presentando durante la 
cesión. Incluso pudo resolver mentalmente algunos de los problemas que le plantearon en es- 
tado de parálisis. De esta forma, quedaba claro que el pensamiento podía existir en ausencia de 
cualquier actividad, por inapreciable que fuera, de los músculos asociados a los órganos del 
habla. 

Pensamiento en personas con graves trastornos del lenguaje. Hay personas que han nacido 
sin la capacidad de hablar, pero pueden pensar. Otras han nacido con la capacidad de hablar, 
pero una enfermedad neurodegenerativa los ha privado completamente del habla, sin afectar 
apenas a los procesos de pensamiento. El ejemplo más llamativo es el de Stephen Hawking, 
uno de los físicos contemporáneos más brillantes, postrado desde hace décadas en una silla de 
ruedas, sin capacidad de habla ni de conducta motora alguna, como consecuencia de la 
esclerosis lateral amiotrófica. Gracias a movimientos residuales de sus dedos, puede 
pronunciar conferencias mediante un sintetizador de voz y es obvio que su mente lleva a cabo 
procesos de pensamiento al máximo nivel de abstracción. También puede existir pensamiento 
sin lenguaje en los niños sordos (Furth, 1981). 

Durante los años sesenta, en Estados Unidos hubo muchos niños sordos, hijos de padres 
oyentes, que recibieron una inadecuada estimulación lingúística, porque los progenitores no 
aprendieron el lenguaje de los signos al albergar la esperanza de que sus hijos pudieran 
aprender el inglés. Paradójicamente, los niños sordos hijos de padres sordos tuvieron un 
desarrollo lingúístico mejor, al emplear el lenguaje de los signos desde el principio. Esta 
situación llevó a Hans Furth a comparar el desarrollo cognitivo de estos dos grupos de niños, 
como describe en su libro de 1966, Pensamiento sin lenguaje: implicaciones psicológicas de la 
sordera. Furth señaló que las evidencias obtenidas a través de varios estudios no mostraban 
grandes diferencias entre ambos grupos, si bien el desarrollo cognitivo de los niños inmersos 
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desde un principio en una lengua de signos era mejor y, en muchos casos, indistinguible del de 
los niños con audición normal. 

La comprensión precede a la producción en el desarrollo del lenguaje. En el proceso 
normal de adquisición del lenguaje, los niños pueden comprender frases que aún no son 
capaces de producir. Por ejemplo, un niño de 1 año de edad, que se encuentra en la fase de 
producción de palabras aisladas, puede entender oraciones como «pon la galleta en la mesa» o 
«pon la pelota en la silla». Es decir, los procesos de comprensión llevan un importante 
adelanto sobre los de producción lingúística, lo que significa que un niño puede comprender, 
tener conceptos e ideas, es decir, procesos de pensamiento, sin tener todavía habla propia. 

Es posible pensar una cosa y hablar sobre otra. En ocasiones nos sorprendemos a nosotros 
mismos manteniendo una conversación insustancial con una persona y, al mismo tiempo, 
pensando sobre lo que vamos hacer 2 horas más tarde. Si el habla tuviera que ser siempre, y de 
forma inevitable, la base del pensamiento, esto no sería posible. 

Todas las evidencias descritas indican que es posible el pensamiento sin la participación 
obligatoria del habla externa, pero esto no significa que el lenguaje no cumpla ningún papel en 
el pensamiento, ya que es posible que alguna forma de lenguaje interno intervenga en todos 
estos casos. 


LENGUAJE Y PENSAMIENTO EN EL NIÑO: PIAGET FRENTE A VIGOTSKY 

Un terreno muy apropiado para estudiar las relaciones entre pensamiento y lenguaje es el 
estudio del desarrollo cognitivo. Los psicólogos han vuelto la mirada hacia el momento en que 
tanto el lenguaje como el pensamiento comienzan a formarse en sus primeras etapas del 
desarrollo del niño, con la esperanza de comprender mejor la naturaleza de su relación. En este 
sentido, son conocidas las posiciones divergentes de dos de las grandes figuras que se han 
ocupado de la cuestión: Lev Vigotsky y Jean Piaget. 

Suele pensarse en el «debate» entre estos autores sobre la prioridad del lenguaje (Vigotsky) o 
del pensamiento (Piaget) durante el desarrollo evolutivo, pero se debe señalar que, aunque 
fueron contemporáneos -ambos nacieron en 1896-, el contraste de sus ideas se produjo de 
forma diferida e indirecta, por dos razones: la gran barrera lingúística y política que separaba 
entonces a la Unión Soviética del mundo occidental en las primeras décadas del siglo XX, y la 
muerte prematura de Vigotsky a los 38 años de edad. Vigotsky publicó su obra más influyente, 
Pensamiento y lenguaje, en ruso en 1934, y no fue traducida al inglés hasta 1962, mucho 
después de su muerte. En su libro, Vigotsky comentó la obra de Piaget (1923) El lenguaje y el 
pensamiento en el niño, y Piaget no respondió hasta 25 años más tarde de la muerte del ruso, 
cuando leyó por primera vez su obra. Piaget lo lamentaba así: 

No puede ser más que con pena que un autor descubre, veinticinco años después de su 
publicación, el trabajo de un colega desaparecido durante ese tiempo, sobre todo si se tiene 
en cuenta que contenía tantos puntos de interés inmediato para él que podían haber sido 
discutidos personalmente y en detalle. Aunque mi amigo A. Luria me había mantenido al tanto 
de la posición simpatizante, y crítica a la vez, de Vigotsky hacia mi obra, nunca pude leer sus 
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escritos o ponerme en contacto con él; y hoy al leer su libro lo lamento profundamente, ya que 
de haber sido posible un acercamiento podríamos haber llegado a entendernos sobre una 
cantidad de puntos (reedición de 1981, pág. 37). 

Ambos autores defendían posiciones teóricas distintas sobre la relación entre el pensamiento y 
el lenguaje. El interés fundamental de Piaget se centraba en las etapas del desarrollo de la 
inteligencia en el niño, y no le prestaba excesiva atención al lenguaje ni a las relaciones entre 
pensamiento y lenguaje. Para Piaget, el lenguaje no era sino una consecuencia, un reflejo de la 
evolución del pensamiento infantil. Este pensamiento evoluciona y madura desde una forma 
de relación con el entorno de tipo sensoriomotor, hasta la aparición de la función simbólica y 
de las representaciones mentales. El lenguaje no es más que la manifestación, en el desarrollo 
ontogenético, de la función simbólica y tiene un papel subordinado al desarrollo de las 
estructuras cognitivas. 

Para Vigotsky, en cambio, pensamiento y lenguaje son, en un principio, procesos 
independientes, con orígenes separados, hasta que, aproximadamente a la edad de 2 o 3 años, 
se establece la unión entre ambos. Antes existe un pensamiento prelingúístico, sin palabras, y 
un lenguaje preintelectual sin pensamiento, que siguen caminos distintos. A partir de un 
momento dado, los dos caminos se juntan y el pensamiento se hace verbal, y el habla, racional. 
Se produce la conexión entre el pensamiento y el lenguaje, en un proceso en el que tiene un 
papel clave la progresiva internalización del habla egocéntrica. 

El «debate» entre los dos autores se centra precisamente en el lenguaje egocéntrico del niño, 
estudiado por ambos aunque por razones distintas. Cualquiera que esté familiarizado con un 
jardín de infancia o un aula de preescolar, sabe que son habituales las situaciones en que niños 
y niñas están enfrascados en una actividad individual (p. ej., jugando con plastilina), mientras 
resuena un parloteo de monólogos simultáneos. Se trata del lenguaje egocéntrico, es decir, una 
forma de habla que, aunque se pronuncia en voz alta, no tiene finalidad de comunicación. 
Generalmente, los niños hablan sobre lo que están haciendo, sin aparente intención de decirlo 
a nadie. 

Ambos autores asignan papeles muy diferentes al lenguaje egocéntrico. Piaget contrapone este 
lenguaje egocéntrico al lenguaje social, cuyo objetivo es comunicarse con los demás. Para él, 
el lenguaje egocéntrico es una manifestación más del egocentrismo, una característica de la 
inmadurez cognitiva del niño, ya que éste se coloca en el centro del mundo y es incapaz de 
descentrar su punto de vista y ponerse en el lugar del otro. El niño no trata verdaderamente de 
ponerse en lugar del que escucha, ni de adaptar su mensaje a las necesidades de información 
del oyente. En la medida en que el niño evoluciona y va superando su egocentrismo, el 
lenguaje egocéntrico pierde importancia hasta que prácticamente desaparece hacia los 6 o 7 
años de edad, dejando paso al lenguaje social. En definitiva, el lenguaje egocéntrico es el mero 
reflejo del pensamiento egocéntrico, un estadio pasajero de la evolución cognitiva. 

Desde el punto de vista de Vigotsky, en cambio, el lenguaje egocéntrico desempeña un papel 
clave en la génesis del pensamiento. Entiende que es una forma necesaria de transición desde 
el habla externa al habla interna, que estaría en la base del pensamiento del adulto. El lenguaje 
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egocéntrico del niño se va internalizando, haciéndose progresivamente más íntimo y privado, 
al tiempo que desempeña una función primordial en la regulación y el control de la propia 
conducta (Welsh, 1986). El habla egocéntrica y el habla interna siguen siendo formas de 
lenguaje, pero formalmente mucho más elípticas que el lenguaje social o comunicativo. Así, 
en ambos casos se elimina la mención del sujeto, situándose el foco en el predicado. 
Vigotsky considera que el lenguaje egocéntrico no significa ausencia completa de propósito de 
comunicación, ni tampoco indica que el hablante no sea consciente de la presencia y el punto 
de vista del oyente. La falta de comunicación se debe, simplemente, a que el lenguaje 
egocéntrico y el lenguaje social cumplen funciones diferentes. Gracias al primero, el niño 
vocaliza su pensamiento y le sirve de guía en sus actividades. Esta vocalización desaparece en 
la medida en que se va convirtiendo en lenguaje interno. De esta forma, «el habla interna 
equivale en gran medida a pensar, no con palabras sino con el significado de éstas» (Vigotsky, 
1962, p. 149). Para el autor ruso, el habla interna o privada tiene una estructura propia distinta 
del habla externa. Se trata de una visión sobre la función del habla en el pensamiento mucho 
más sofisticada que la del habla subvocal propuesta por los conductistas. El significado se 
nutre del lenguaje, pero no se identifica con él; pensamos con ideas que aparecen como un todo 
y que luego traducimos en frases y palabras en un orden secuencial. Vigotsky ejemplificaba: 
Cuando deseo comunicar el pensamiento de que hoy he visto un chico descalzo corriendo 
calle abajo con una camisa azul, no veo cada elemento por separado: el chico, la camisa, su 
color azul, su carrera, su falta de zapatos. Concibo todo eso en un pensamiento [...] En la 
mente del hablante, el todo se presenta de una vez, pero en el habla tiene que ser desarrollado 
de forma sucesiva (Vigotsky, 1962, p. 150). 

El habla egocéntrica es observable en los niños, pero el habla interna postulada por Vigotsky 
es difícil de estudiar, ya que, por definición, se trata de un fenómeno mental encubierto. El 
autoinforme y las entrevistas clínicas pueden proporcionar algunos datos, pero muy indirectos 
y mediatizados por la introspección, un método de dudoso valor científico. En cierta medida, 
el habla interna de Vigotsky está relacionada con el «flujo del pensamiento» (the stream of 
thought), postulado por William James para caracterizar los procesos de la conciencia, cuando 
pensamos o estamos ensimismados. La diferencia es que James no le daba especial 
protagonismo al lenguaje (James, 1890). Las modernas técnicas de neuroimagen, como las de 
resonancia magnética funcional, podrían darnos pistas sobre el habla interna o sobre el flujo 
del pensamiento. Cuando se registra la actividad cerebral de un individuo en estado de reposo, 
es decir, cuando no se le pide realizar ninguna tarea experimental concreta, se observa una 
actividad neuronal masiva en la denominada red «en modo por defecto»: cortezas temporal 
medial, frontal medial, parietal inferior y cingulada posterior, entre otras. De hecho, cuando se 
le pide a los participantes que realicen una tarea concreta, como, por ejemplo, comprender el 
lenguaje, se desactiva gran parte de la red por defecto (Buckner et al., 2008). Evidentemente, 
el cerebro de una persona que «no está haciendo nada» sí está haciendo algo: recuerda 
episodios, planea metas, fantasea o sueña despierta, explora los puntos de vista de los demás, 
siente emociones y, sin duda, activa retazos de habla interna. Toda esa actividad interna tiene 
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un enorme coste metabólico, como indican las técnicas de neuroimagen, e involucra una gran 
red cerebral. Pero ¿se incluyen en esta red por defecto las áreas relacionadas con el lenguaje? 
La respuesta es: aparentemente, no. Si el habla interna desempeñase un papel dominante en el 
pensamiento, tendría que aparecer una activación significativa en las áreas de Broca y/o de 
Wernicke, y no es así. 

La ciencia avanza cuando obtiene datos que permiten apoyar o refutar unas teorías frente a 
otras, y los datos cobran su verdadero sentido cuando se sitúan dentro de un marco teórico. Un 
valor añadido de las concepciones piage-tiana y vigostkiana es que hacen predicciones 
opuestas que pueden ser comprobadas empíricamente. Así, la primera sostiene que el lenguaje 
egocéntrico se debe a la falta de socialización; de modo que cuanto menos «social» sea una 
situación, más probabilidades habría de que aquél apareciera, en detrimento del lenguaje 
comunicativo. Vigotsky predice lo contrario: el niño utiliza únicamente el lenguaje de que es 
Capaz, usa el habla egocéntrica en el contexto social y, cuando se atenúan las condiciones 
sociales, la frecuencia del lenguaje egocéntrico debería también disminuir. Vigotsky llevó a 
cabo una serie de experimentos en los que restringía el contexto social del niño: lo situaba 
junto con otros niños sordomudos, con extranjeros que hablaban otra lengua, con 
desconocidos, o los dejaba solos en la sala (Dale, 1980). En todos los casos, el lenguaje 
egocéntrico disminuía significativamente en frecuencia. Parece que el hecho de sentirse 
escuchado y acompañado es importante para que el niño produzca lenguaje egocéntrico. Por */ 
desgracia, la falta de detalles metodológicos hace difícil interpretar apropiadamente los 
experimentos de Vigotsky. 

Es difícil comparar los datos de ambos autores, porque proceden de ámbitos muy distintos. 
Muchos de los estudios de Piaget se realizaron en la Maison des Petits del Instituto Rousseau 
de Ginebra, un jardín de infancia muy orientado hacia el trabajo individual y poco favorecedor 
del trabajo de grupo. Los estudios de Vigotsky, por el contrario, se inscriben en el marco de la 
Unión Soviética nacida de la revolución, donde se exaltaba el sentido de la colectividad y en 
cuyas escuelas se potenciaba al máximo la actividad cooperativa de grupo. Es sorprendente 
que luego no se hayan replicado estos estudios en condiciones más controladas. 


PRIORIDAD DEL LENGUAJE: LA RELATIVIDAD LINGUÍSTICA 
e Planteamiento de Sapir-Whorf 

La hipótesis de la relatividad lingúística, defendida por Whorf y Sapir en el primer tercio del 
siglo XX, postula, en su formulación más radical, un verdadero determinismo lingúístico sobre 
la cognición humana. La hipótesis de la relatividad lingilística también se denomina hipótesis 
de Sapir-Whorf o, más comúnmente, hipótesis whorfiana, dado que Whorf fue quien la 
articuló, la defendió apasionadamente y la popularizó. La idea central es que las características 
particulares de la lengua materna determinan la estructura de los procesos de pensamiento. 
Nuestra lengua afectaría el modo en que recordamos las cosas y la manera en que percibimos 
el mundo, pensamos sobre el mundo e, incluso, actuamos sobre él. La idea tiene implicaciones 
filosóficas y prácticas: en última instancia, la «naturaleza» humana sería tan variable como la 
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propia variedad de las lenguas, y algunos matices conceptuales propiciados por algunas 
lenguas serían intraducibies a otras. Esta idea relativista subyace a algunas creencias populares 
como que el alemán es la lengua de la filosofía o que los matices de la poesía sólo se mantienen 
en su lengua original. 

¿Cómo llegó Whorf a esta propuesta? Es interesante considerar brevemente su biografía para 
entender la génesis de sus argumentos. Whorf no era un lingúista profesional, sino un 
ingeniero químico que trabajó de inspector de incendios en una compañía de seguros la mayor 
parte de su vida. Sus creencias religiosas lo llevaron a estudiar la Biblia en su versión hebrea, 
con el fin de desvelar significados ocultos que, según él, no se apreciaban en las traducciones 
occidentales. Posteriormente, este interés por las diferencias lingúísticas lo llevó a estudiar de 
forma autodidacta las lenguas amerindias y a aproximarse a la Universidad de Yale, donde 
trabó amistad con el profesor de lingúística Edward Sapir, quien lo ayudó a desarrollar su 
planteamiento relativista. A pesar de que nunca fue un académico profesional, llegó a ser un 
experto en lingúística comparada, publicando varios artículos sobre las lenguas de América 
muy apreciados por los profesionales de su tiempo. Es esta familiaridad con las lenguas 
indígenas la que lo llevó a plantearse que las diferencias en vocabulario y sintaxis entre 
lenguas deben inducir diferencias conceptuales a veces irreductibles. 

En algunos pasajes, Whorf se acerca a una especie de determinismo lingiístico-, es decir, las 
categorías o conceptos del pensamiento están determinadas por las categorías que proporciona 
la lengua que uno habla. Uno de los textos más citados de Whorf dice: 

Diseccionamos la naturaleza según las líneas que nos marca nuestra lengua materna. Las 
clases y categorías que aislamos del mundo de los fenómenos no las encontramos ahí 
simplemente porque estén delante de cualquier observador; al contrario, el mundo se 
presenta como un flujo caleidoscópico de impresiones que espera ser organizado por nuestras 
mentes y, sobre todo, por nuestros sistemas lingúísticos. La forma peculiar en que dividimos 
la naturaleza, la organizamos en conceptos y le atribuimos significados depende, en gran 
medida, del hecho de que formamos parte de un acuerdo para organizaría de este modo, un 
acuerdo que vale para toda nuestra comunidad de hablantes y que se halla codificado en los 
esquemas de nuestra lengua. Por supuesto, se trata de un acuerdo implícito y no declarado, 
pero sus términos son absolutamente obligatorios-, no es posible hablar sin someternos a la 
organización y clasificación de datos decretada por ese acuerdo (Whorf, 1940, pp. 213-214). 
Whorf proporciona algunos ejemplos de cómo la lengua determinaría el modo de pensar de sus 
hablantes. Así, mientras que el inglés tiene un único término para referirse a la nieve, los 
esquimales disponen en su lengua (inuit) de un gran número de palabras para designar la nieve 
en sus distintas variedades y situaciones: nieve que cae, nieve que está en el suelo, nieve dura y 
compacta, nieve a medio derretir, bloque de nieve, etc. De esta manera, los esquimales verían 
y entenderían el mundo de forma muy distinta en lo que se refiere a la nieve, un elemento 
omnipresente en su vida diaria. Sus conceptos y formas de pensar al respecto serían 
completamente diferentes de las de un inglés. 
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Otros ejemplos citados por Whorf se refieren a la lengua de los indios hopi, en la que era un 
gran experto. Según él, en esta lengua no existen palabras ni formas gramaticales para referirse 
al tiempo; lingiiísticamente no existen el pasado, el presente o el futuro, por lo que el concepto 
de tiempo que puede tener un hopi sería muy distinto del de un inglés o un español. Su sentido 
de la duración iría más ligado al tiempo subjetivo que al tiempo como una dimensión física del 
mundo e independiente de las personas. En palabras de Whorf, sería muy difícil que dos 
físicos, uno inglés y otro hopi, se entendieran entre sí dadas las enormes diferencias que 
separan ambas lenguas. Por su parte, la lengua de los hopi es mucho más articulada que las 
lenguas indoeuropeas a la hora de expresar movimientos. Así, los verbos de movimiento 
disponen de una serie de prefijos que expresan de forma obligatoria distinciones finas de mo- 
vimientos en onda, aleteo, zigzag, helicoidal, giro, etc. Por supuesto, en inglés o castellano 
también se pueden expresar esos movimientos, pero sólo opcionalmente y empleando una 
oración (p. ej., «caminaba haciendo eses»). En cambio, en hopi, el hablante está obligado a 
elegir un prefijo verbal (al igual que lo estamos nosotros con los sufijos de tiempo verbal) y, 
por lo tanto, se debe prestar atención necesariamente a la forma del movimiento. 
e Críticas iniciales a la relatividad whorfiana 

Las críticas a la relatividad de Whorf no se hicieron esperar y fueron especialmente furibundas 
por parte de las teorías «universalistas» del lenguaje, que enfatizan las similitudes entre las 
lenguas al postular un origen biológico común para todas ellas (p. ej., Lenneberg, 1967). En 9 
primer lugar, las observaciones de Whorf sobre las peculiaridades lingúísticas no siempre 
fueron precisas. Por ejemplo, en relación con la lengua inuit de los esquimales, no es exacto 
que tenga decenas de nombres para la nieve; según ya había observado el antropólogo Boas 
varios años antes, en inuit hay sólo cuatro lexemas o raíces distintas para la nieve, y los 
términos restantes son combinaciones entre esos lexemas. Si se compara con el inglés, éste 
tiene un único lexema fsnow”), pero, a través de combinaciones con otros, despliega una gran 
variedad de significados y matices: 'snowflake', 'snowstorm', 'snowdrift', 'snowfall', 'snowball", 
'snowcapped', 'snow bank', 'snow cornice', 'snow house', 'snow man, etc. Además, los 
esquiadores se inventan combinaciones nuevas para comunicar matices importantes en su 
deporte: 'powder snow" (nieve polvo), 'flaky snow' (nieve escamosa) y otras. Incluso la lengua 
de un país semidesértico, como España, tiene bastantes palabras al respecto: nieve, aguanieve, 
nevada, nevero, avalancha, alud, etc. Parece ser, como detalla Martin (1986), que las cuatro 
raíces señaladas por Boas fueron infladas a siete por Whorf, y después se fue exagerando más 
y más a medida que la cuestión se abordaba desde los medios escritos, hasta llegar a un 
centenar, por ejemplo, en un editorial del New York Times. En palabras de Pinker (1995), el 
asunto de las palabras esquimales sobre la nieve llega a nuestros días como una de las tantas 
«leyendas urbanas» que circulan de boca en boca y que todo el mundo acepta sin más, pese a 
su carencia de base real (junto a otras como que sólo aprovechamos el 10% de nuestro cerebro, 
que se puede manipular fácilmente la voluntad humana a través de mensajes subliminales o 
que las espinacas son ricas en hierro). Tampoco los hopi tienen una falta absoluta de referentes 
temporales, como pensaba Whorf. Estudios posteriores más rigurosos han puesto de relieve 
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que la lengua hopi tiene tiempos verbales, unidades temporales, metáforas sobre el tiempo, etc. 
(Malotki, 1983). 

En segundo lugar, la interpretación que hace Whorf de los datos es también dudosa. El hecho 
de que una lengua tenga un vocabulario más rico que otra sobre ciertos aspectos del mundo, no 
implica necesariamente que determine el pensamiento del hablante; al menos no en la forma 
radical que Whorf planteaba. No es de extrañar que el árabe tenga más palabras que el español 
para referirse a «camello» o que las lenguas australianas tengan multitud de términos para 
«arena» o «agujero». Como refiere Pullum (1991) en su trabajo El gran fraude del vocabulario 
esquimal y otros ensayos irreverentes sobre el estudio del lenguaje (en inglés), «los criadores 
de caballos tienen varios nombres para las razas, los tamaños y las edades de los caballos; los 
botánicos usan diferentes nombres para designar las formas de las hojas; los decoradores 
tienen varios términos para referirse a los distintos tonos de malva; los impresores utilizan 
distintos nombres para los tipos de letras. Esto no tiene nada de extraordinario [...] ¿A alguien 
se le ha ocurrido decir sobre los impresores las mismas memeces que se dicen de los 
esquimales en los malos libros de lingúística?» Por supuesto, los significados de las palabras 
varían enormemente de unas lenguas a otras, pero, el hecho de que un idioma no disponga de 
un término para un determinado sentido o matiz, no quiere decir que no pueda acercarse a él a 
través de circunloquios o combinaciones de otras palabras, como se ha visto para el caso de la 
nieve en inglés. Curiosamente, el español es rico en términos para identificar los distintos 
resultados que pueden obtenerse cortando una materia con un cuchillo (Crystal, 1994): rodaja, 
rebanada, cortada, loncha, corte, filete, tajada, lonja, etc.; muchas lenguas tienen un único o, a 
lo sumo, dos vocablos para todos ellos, pero sus hablantes podrían expresar tales matices, o 
aproximarse a ellos, utilizando otras palabras: rebanadas (cortes de pan), lonchas (cortes de 
embutidos), filetes (cortes de carne), etcétera. 

Aunque Whorf no fuese totalmente riguroso en sus observaciones, y a veces aventurase 
interpretaciones excesivas de sus datos, la relatividad lingúística constituye una buena teoría, 
ya que es falsable. Es decir, sus predicciones son suficientemente explícitas como para que 
puedan someterse a análisis empíricos con resultados favorables o desfavorables para la teoría. 
El trabajo pionero de Carmichel et al. (Recuadro 4-1) parecía dar la razón a una versión 
moderada de la hipótesis relativista: las etiquetas verbales modifican el recuerdo de estímulos 
visuales, pero se trata de una tarea que nos dice más sobre el funcionamiento de la memoria 
que sobre las diferencias conceptuales determinadas por diferencias lingiiísticas. Al fin y al 
cabo, dichos autores no compararon hablantes de diferentes lenguas. 
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Recuadro 4-1. El lenguaje modula el recuerdo visual 


Uno de los primeros trabajos que demostraron de forma empírica la influencia del lenguaje 
sobre los procesos perceptivos y de memoria es el experimento, ya clásico, de Carmichael, Hogan 
y Walter (1932). Se presentó a los participantes una serie de dibujos esquemáticos, uno por vez, 
junto con una etiqueta verbal (un nombre). Cada dibujo era suficientemente ambiguo para que 
se le pudieran asociar dos etiquetas distintas. Por ejemplo, uno de ellos consistía en dos círculos 
unidos por una línea horizontal que podía estar asociado a la etiqueta «gafas» o bien a «pesas» . 
Los participantes se dividieron en dos grupos; a ambos se les administraron los mismos dibujos, 
pero con una etiqueta distinta en cada grupo. 
La tarea consistía en dibujar de memoria cada 
dibujo lo más fielmente posible al original. 


Estímulo Recuerdo 


Se comprobó que, aunque era una tarea per- 
ceptiva y de memoria visual, ésta se veía muy 
influida por la etiqueta que había acompañado a 
cada dibujo en su presentación inicial. Así, en el 
ejemplo, cuando se asoció con la etiqueta «ga- 
fas», los círculos se dibujaron ovalados con una 
línea curva entre ambos; cuando se asoció con 
la etiqueta «pesas», los círculos se dibujaron re- 
dondos con una gruesa línea recta en el centro, 


como se muestra en la figura 4-2. Era como si 
los sujetos, en lugar de copiar directamente del 
recuerdo visual, «copiaran» de su representación 
mental del concepto transmitido por la palabra. 


Figura 4-2. Ejemplos de estímulos (izquierda) usa- 
dos en el experimento de Carmichael et al. (1932) 
y ejemplos de respuestas (derecha) moduladas por 
las etiquetas verbales. 


Un terreno especialmente propicio para verificar la hipótesis whorfiana es el de la codificación 
y memoria de los colores. Se parte de la base de que la luz es un fenómeno físico que se 
presenta a través de un continuo de longitudes de onda, desde el rojo al violeta. Por otra parte, 
el sistema visual humano es también el mismo para todos y, en consecuencia, la percepción de 
los colores debería ser universal (salvo en los daltónicos). Por lo tanto, la división del espectro 
luminoso en colores no es arbitraria, sino que se basa en la fisiología de la visión y su sistema 
de detectores retinianos. Sin embargo, las lenguas difieren en la riqueza de su vocabulario para 
los colores. De hecho, algunas lenguas sólo tienen nombres para alguno de los colores 
primarios, mientras que otras disponen de un repertorio de decenas de términos cromáticos. Lo 
importante es que estas diferencias de vocabulario obligarían a clasificar los colores de formas 
diferentes. Por ejemplo, si los hablantes de una lengua tuviesen nombres para el azul y para el 
amarillo, pero no para el verde, estarían obligados a clasificar los objetos verdes como azules o 
como amarillos o, quizás, a considerar que no tienen color. La pregunta clave es: si una lengua 
no tiene etiquetas verbales para distinguir entre dos colores, ¿pueden los hablantes de esa 
lengua percibir las diferencias entre esos dos colores, memorizarlos y reconocerlos igual de 
bien que los hablantes de otra lengua que sí los distingue? 

En un trabajo con hablantes de casi un centenar de lenguas, Berlin y Kay (1969) encontraron 
que los participantes de todas ellas eran bastante consistentes al clasificar los colores más 
básicos o focales. Sólo difería el número de colores nombrados. Según los autores sólo hay 11 
colores básicos: negro, blanco, rojo, amarillo, azul, verde, marrón, violeta, rosa, naranja y gris. 
En su análisis translingúístico, Berlin y Kay observaron que las denominaciones de los colores 
no se reparten de forma arbitraria entre las lenguas, sino que existe una jerarquía predecible. Si 
una lengua sólo tiene dos términos de color, éstos serán para nombrar el blanco y el negro, lo 
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que incluye también los colores claros y oscuros, respectivamente. Si sólo tiene tres términos, 
éstos serán blanco, negro y rojo. Si tiene cuatro términos, serán una de estas dos 
combinaciones: los tres anteriores + verde o los tres anteriores + amarillo. Con cinco términos, 
se incluyen el verde y el amarillo, además de los anteriores. 

Con seis, se añade el azul, y con siete, se añade el marrón. Con más de siete, entran en juego el 
violeta, el naranja, el rosa y el gris. Es decir, hay un patrón universal en la denominación de los 
colores que está determinado por el número de las categorías cromáticas; justamente lo contra- 
rio que predice la hipótesis relativista. 

Eleanor Rosch Heider (Heider, 1972) trabajó con nativos de la tribu dani de Papua-Nueva 
Guinea, quienes sólo disponen de dos nombres para los colores: 'mili' para el blanco y los 
colores claros, y 'mola' para el negro y los colores oscuros. Heider les enseñó a poner nuevos 
nombres a otros colores y comprobó que podían aprender y recordar mejor los colores focales 
o básicos (un rojo rojo) que los otros (un rojo desvaído, un rojo amarillento). Como los dani no 
tenían nombres para ninguno de estos colores, las diferencias nos hacen pensar en razones 
fisiológicas. Abunda en esta idea el hecho de que los niños de 3 años también prefieren los 
colores básicos. 

El hecho de que existan importantes restricciones biológicas hacia unas zonas del espectro 
cromático frente a otras, ha llevado a algunos autores a cuestionarse la idoneidad de los colores 
como banco de pruebas de la relatividad lingúística (Pinker, 1995). Si aparecen diferencias en 
el procesamiento, éstas podrían deberse a causas fisiológicas y no a causas lingúísticas. Pese a 
ello, algunos trabajos más recientes han conseguido identificar efectos lingiísticos separados 
de los biológicos. 

Kay y Kempton (1984) compararon hablantes del inglés con hablantes del tarahumara, una 
lengua uto-azteca del norte de México. El inglés distingue entre azul y verde, pero el 
tarahumara, no: tiene un término, 'siyóname', que incluye a ambos colores. La predicción de la 
hipótesis de Sapir-Whorf es que los colores intermedios entre azul y verde serán discriminados 
mejor por los angloparlantes que por los tarahumara. Como estímulos se usaron ocho colores 
dentro del continuo azul-verde. La técnica consistió en la comparación de tríadas: de un 
conjunto de tres colores se pregunta por el que es más distinto del grupo. Se utilizan múltiples 
combinaciones de tríos con todos los estímulos y así se puede calcular la «distancia» 
perceptiva entre los colores. Esta técnica se ha usado con habilidad en muchos campos de la 
percepción. Los resultados mostraron un claro efecto «whorfiano»: el espacio subjetivo de los 
angloparlantes se distorsionaba, exagerando las distancias perceptivas en la zona intermedia, 
es decir, en el límite —para ellos— entre el azul y el verde, mientras que las distancias en los 
tarahumara eran más uniformes. Es decir, los angloparlantes percibían ciertos colores más 
distintos entre sí que los tarahumara, porque en inglés se nombran de forma diferente; así pues, 
su percepción era de tipo categórica. 

Un trabajo bastante citado, publicado en Nature, es el de Davidoff, Davies y Roberson (1999), 
en el que se comparan angloparlantes con nativos berinmo, una de las múltiples tribus de 
Papua-Nueva Guinea, todavía en la Edad de Piedra. Gracias al procedimiento habitual en el 
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que se usa la carta estándar de colores de Munsell, que los ordena por matices de tonos y 
saturación, los autores pudieron establecer las categorías cromáticas de los berinmo 
observando cómo nombraban los distintas muestras de color. Según esto, los berinmo tienen 
sólo cinco vocablos para los colores; no establecen la distinción entre el azul y el verde, porque 
agrupan ambos colores bajo un mismo término ('nol'”), pero, por el contrario, tienen una 
distinción ('nol' frente a 'wor') que no existe en inglés o castellano (para nosotros serían 
diferentes matices de un marrón verdoso). Sometieron a hablantes del inglés y nativos berinmo 
al mismo procedimiento experimental que usó Heider con los dani: se presenta brevemente un 
color y, tras un intervalo de 30 segundos, el participante debe reconocerlo entre dos colores; la 
tarea es más difícil cuanto más parecidos se perciban estos dos últimos. Como estímulos, se 
usaron colores dentro del continuo azul-verde y del continuo 'nol-wor'. Los datos revelaron, 
sin lugar a dudas, que los angloparlantes recordaban y discriminaban mejor los estímulos 
cuando éstos cruzaban las categorías azul/verde que las de 'nol/wor', mientras que a los 
berinmo les sucedía al revés. Así pues, era evidente que la forma en que cada lengua codifica 
los colores influye sobre el modo en que éstos son percibidos y recordados por los hablantes. 
Otros experimentos con ambos grupos de individuos extendieron el estudio a nuevas 
categorías de colores, algunas inexistentes en las dos lenguas (verde tipo 1 frente a verde tipo 
2). Sus hallazgos llevaron a estos autores a poner en duda la universalidad biológica de los 
colores básicos y a defender una relatividad lingiiística fuerte. 
e Resurgimiento de la relatividad lingúística: propuestas neowhorfianas 

La valoración científica de la relatividad whorfiana ha sufrido muchos altibajos a lo largo del 
tiempo, pero en las últimas décadas la hipótesis ha experimentado un resurgimiento notable, 
impulsada por psicólogos y lingiistas neowhorfianos, como George Lakoff, Melissa 
Bowerman, John Lucy, Alfred Bloom o Stephen Levinson. Los neowhorfianos aseguran que 
los efectos relativistas hay que buscarlos en las diferencias gramaticales más que en las 
diferencias léxicas entre los idiomas. Estamos acostumbrados a considerar que el significado 
lingúístico reside en los elementos léxicos o palabras de contenido (nombres, verbos, 
adjetivos), mientras que la gramática sería un sistema de organización formal o estructural del 
lenguaje. Sin negar este carácter estructural, lo cierto es que los elementos gramaticales, como 
los afijos y las palabras funcionales (preposiciones, determinantes, pronombres, conjunciones, 
verbos auxiliares, etc.), también tienen una importante carga semántica. Más aun, establecen 
vínculos o relaciones conceptuales, no meramente formales, entre los elementos léxicos, de 
modo que constituyen una especie de semántica de orden superior. Veamos lo que afirma el 
lingitista Derek Bickerton sobre la gramática con ejemplos adaptados al español: 

Las relaciones que los elementos gramaticales pueden expresar incluyen la localización 
relativa (encima, debajo, sobre, junto a), el tiempo relativo fantes, después, mientras y los 
afijos temporales de los verbos), la cantidad relativa (mucho, muchos, poco, pocos y el sufijo 
de plural -s), la dirección relativa (hacia, desde, hasta, a través, derecha, izquierda, arriba, 
abajo), la familiaridad relativa (el/la para cosas que el interlocutor reconocerá y un/una para 
cosas que no reconocerá), la posibilidad relativa (quizá, acaso, podría), la contingencia relativa 
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(a menos que, aunque, porque), así como una variedad de relaciones como la posesión (de, 
mío, tuyo), agencia (por), propósito (para), necesidad (tiene que, hay que), existencia (es), no 
existencia (no, nadie, nunca), y así sucesivamente (Bickerton, 1990, p. 55). 

A Bickerton le asombra que el número de conceptos incorporados en la gramática sea tan 
limitado y que, además, éstos sean compartidos por la mayoría de las lenguas, lo cual apoyaría 
la tesis universalista del lenguaje que él defiende. Así, algunos conceptos, como el tiempo, el 
espacio, la causalidad, la posesión o la cantidad están gramaticalizados en casi todas las 
lenguas, mientras que otros conceptos, que a priori podrían parecer igualmente importantes, no 
aparecen gramaticalizados en ninguna lengua del mundo. Por ejemplo, las distinciones 
comestible/no comestible, amistoso/hostil, peligroso/ seguro o agradable/desagradable, sin 
duda de gran valor biológico o adaptativo, están ausentes en todas las gramáticas. 


Tabla 4-1. Algunas diferencias gramaticales entre el inglés y el español 


Género en nombres y adjetivos 


Número en los verbos 


Pronombres de proximidad 
o estatus 


Cópulas para estado y rasgo 


Preposiciones de contacto 
de superficie y de contenedor 


Demostrativos y pronombres 
de distancia 


Expresiones de irrealidad, posibilidad, 


duda, deseo, creencias, etc. 


Diferencias 
Español: marca morfológica 
Inglés: ausencia de marca 


Español: singular y plural 
morfológicos 


Inglés: singular y plural sólo 
en el pronombre 


Español: túlusted 
Inglés: you 


Español: ser/estar 
Inglés: to be 


Español: en 

Inglés: infon 

Español: este-ese-aquel/aquí- 
ahi-alli 

Inglés: this-that/here-there 


Español: morfología del modo 
subjuntivo 


Inglés: ausencia de morfología 
del modo subjuntivo 


Ejemplos 
El amigo/la amiga 
The friend 


Sacudo/sacuden 
| shake/they shake 


Tú escribes/usted escribe 
You write/you write 


María está dormida/María es 
guapa 


Maria is slept/Maria is hand- 
some 


Lápiz en el vaso/lápiz en la mesa 


Pencil in the glass/pencil on the 
table 


Este libro/ese libro/aquel libro 


This book/that book 


Es posible que Juan venga/Juan 
viene 

Quizá te sorprenda/Sé que te 
sorprende 

No creo que salga a la calle/No 
saldrá a la calle 


Itis possible that John comes/ 
John comes 


Maybe it surprises you/l know it 
surprises you 

| don't thing he will go out/He 
will not go out 


Si bien es cierto que hay un sesgo bastante universal en cuanto a las distinciones conceptuales 
incorporadas en la gramática, también hay algunas excepciones notables. Por ejemplo, unas 
pocas lenguas como el turco o el quechua y el aimara en Sudamérica incorporan en la 
gramática el grado de evidencia de lo que se afirma. Así, en quechua los verbos incluyen afijos 
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que especifican si el hablante conoce el evento de primera mano, si se lo han contado o si lo ha 
supuesto. Por lo tanto, la gramática obliga al hablante de quechua a juzgar y a declarar la 
evidencia de los eventos, lo cual no ocurre en español u otras lenguas indoeuropeas. Pero 
incluso cuando se consideran los conceptos «universalmente» gramaticalizados, las lenguas 
difieren mucho en el grado de articulación de esos conceptos, como se aprecia en los ejemplos 
de la tabla 4-1. 

Estas diferencias gramaticales dentro de un dominio conceptual determinado son 
especialmente importantes para los neowhorfianos por varias razones. En primer lugar, el 
procesamiento de los términos gramaticales es automático, es decir, no implica esfuerzo o 
coste cognitivo adicional. En segundo lugar, el procesamiento gramatical es obligatorio; por 
ejemplo, en español no es posible utilizar nombres sin una marca morfológica de cantidad 
(singular/plural) O sin estar acompañados de un indicador de familiaridad 
(determinado/indeterminado), y los verbos necesariamente incluyen, entre otras, marcas 
morfológicas de tiempo (pasado/ presente/futuro), de persona (hablante/inter-locutor/otra 
persona) o de cantidad (singular/plural). Por lo tanto, las diferencias entre dos lenguas en 
alguno de estos elementos gramaticales implican que los hablantes respectivos deberán 
realizar conceptualizaciones algo diferentes de modo obligatorio y automático cuando 
codifican verbalmente un determinado hecho o situación. Una cuestión sobre la que 
volveremos más adelante es si estas diferencias de codificación determinadas por la lengua se 
limitan al momento del habla o tienen consecuencias más duraderas sobre la memoria y el 
pensamiento en general. 

Curiosamente, muchas de las investigaciones realizadas por los neowhorfianos comparan los 
efectos cognitivos de las diferencias gramaticales entre inglés y español, las dos lenguas 
dominantes en Estados Unidos. A continuación veremos algunas de ellas. 

Verbos copulativos en español y en inglés 

Una peculiaridad del español es la existencia ir dos verbos copulativos «ser» y «estar», 
mientras que en la mayoría de las lenguas sólo hay uno, como es el caso del inglés 'to be". Esto 
conlleva que los hablantes de español estemos obligados a realizar ciertas clasificaciones 
conceptibles, que en otras lenguas no son necesarias, m concreto, cuando nos referimos a una 
propiedad o estado transitorio empleamos «estar», y cuando mencionamos un rasgo 
relativamente permanente elegimos «ser». Así, nosotros dis-nnguimos entre «Juan está 
alegre» (estado) y Juan es alegre» (rasgo), mientras que en inglés ambas expresiones se 
confundirían: «John is happy». Por otra parte, en algunos contextos una elección equivocada 
del verbo copulativo nos llama la atención inmediatamente como un error: «María es 
dormida» no es aceptable, ya que el sueño no es un rasgo sino un estado transitorio, o bien 
«María está italiana» tampoco es válido, puesto que la propiedad «italiana» es un rasgo 
relativamente permanente. En inglés, se utilizaría 'to be' en ambos casos: «Mary is slept» y 
«Mary is Italian», dado que la lengua inglesa no obliga a establecer la clasificación conceptual 
rasgo/estado. Los verbos copulativos españoles también se utilizan de forma específica para 
describir la ubicación de objetos (estar) y de eventos (ser). Por ejemplo: «la mesa está en el 
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jardín» (pero no «la mesa es en el jardín») o «la fiesta es en el jardín» (pero no «la fiesta está en 
el jardín»). De nuevo, el inglés no discrimina entre ambas situaciones: «The table is in the 
garden» y «the party is in the garden». 

No hay duda de que el usuario del español debe hacer discriminaciones conceptuales en línea 
cuando utiliza oraciones copulativas, que el hablante inglés no necesita hacer, y esto parece ser 
favorable a la relatividad whorfiana. Pero la cuestión clave es si los hablantes de español como 
consecuencia de sus demandas gramaticales son más hábiles, de modo general, haciendo 
distinciones estado/rasgo o ubicación de objeto/evento. Algunos estudios así lo indican. Por 
ejemplo, Sera, Bales y del Castillo (1997) compararon a niños de entre 3 y 5 años, hablantes de 
español y hablantes de inglés en tareas que requerían discriminar entre apariencia (aspecto 
transitorio) y realidad (rasgo permanente) de los objetos. Por ejemplo, en una de las tareas el 
experimentador mostraba a los niños una oveja de juguete de color blanco y posteriormente se 
la ocultaba tras un filtro rojo. A los niños españoles se les hacían dos tipos de pregunta sobre la 
apariencia/realidad del objeto, utilizando la cópula apropiada: «Cuando miras a la oveja ahora, 
a través de este filtro, ¿de qué color está?. ¿está blanca o es tu roja:», o bien «De qué color es la 
oveja de verdad ¿es blanca o es roja?» A los niños angloparlantes se les planteaban preguntas 
equivalentes, aunque obviamente utilizando la cópula única del inglés: «When you look at the 
lamb right now through this filter, what color is it? Is it white or is it red?», o bien: «What color 
is the lamb really and truly? Is it white or is it red?» Los resultados indican que los niños 
mayores responden mejor a ambas preguntas sobre apariencia (rojo) y realidad (blanco) que 
los más pequeños en ambos idiomas, como cabe esperar del desarrollo evolutivo de los 
conceptos. Pero, además, los niños españoles en su conjunto mostraron significativamente 
mejor rendimiento en los juicios de realidad (72 %) que los niños ingleses (63 %), indicando 
que la doble cópula del español facilita la conceptualización apariencia/realidad. En un 
segundo experimento Sera et al. utilizaron niños bilingijes de español e inglés, que recibían la 
tarea anterior en ambos idiomas. Lo curioso es que los niños realizaron mejor los juicios de 
realidad cuando se les preguntaba en español (82 %) que cuando se les preguntaba en inglés 
(70 %), lo cual sugiere que el efecto de filtro conceptual del idioma está limitado al momento 
del habla y no es una característica permanente. 

Sin duda, la disponibilidad de dos cópulas obliga a los hispanoparlantes a clasificar 
reiteradamente las propiedades de los objetos como rasgos o estados al hablar. Pero está por 
demostrar que los angloparlantes tengan más dificultad para clasificar las propiedades de los 
objetos como rasgos/estados en tareas no lingúísticas. 

Verbos de movimiento en español y en inglés 

Los investigadores de lingiística comparada han dedicado bastante atención a las diferencias 
de énfasis gramatical que tienen las expresiones de movimiento en inglés y en español (p. ej., 
Talmy, 2000; Naigles et al., 1998, Slo-bin, 2003). Veamos unos ejemplos en ambos idiomas: 
El chico cruzó la calle corriendo. 

The boy run across the street (el chico corrió a través de la calle). 

Mary atravesó la sala bailando. 
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Mary danced her way across the room (Mary bailó dirigiéndose a través de la sala). 

En inglés hay una preferencia por incluir el modo del movimiento ('run/corrió; 'danced/ bailó) 
en el núcleo verbal, y la dirección del movimiento queda relegada a un «satélite» o partícula 
gramatical (across'/a través). En español, en cambio, es más frecuente incorporar la dirección 
del movimiento en el núcleo verbal (cruzó/atravesó) y el modo de movimiento queda como 
optativo en un verbo subordinado, generalmente un gerundio (corriendo/bailando). En la 
terminología de Talmy (2000), el español es una lengua enmarcada en el verbo (verb-framed), 
porque el verbo captura el esquema básico del evento que en el caso del movimiento es la 
dirección o el trayecto. El inglés, por el contrario, es una lengua enmarcada en el satélite 
(satellite-framed), porque el esquema básico del evento se desplaza a una partícula gramatical. 
Pero, ¿tienen estas diferencias de énfasis gramatical consecuencias sobre el modo en que 
segmentamos cognitivamente los eventos? 

Numerosos estudios han intentado responder a esta pregunta. Naigles et al. (1998) presentaron 
a hablantes de español y a hablantes de inglés escenas visuales como la que se muestra en la 
figura 4-3 A y les preguntaron qué hacía el personaje. 


r E A 


Los resultados, 
reflejados en la 

A Modo | a 
5 Dirección figura 4-3 B, 
indican que la 


mayoría de los 


Respuesta (%) 
67] 
O 


“o angloparlantes 
> describen la 

1 escena 

: : Inglés Español incorporando el 
Figura 4-3. A) Ejemplo de estímulo empleado en el experimento de Naigles et al. (1998). B) Porcentaje de expre- a00n y 
siones de modo y de dirección en los hablantes de inglés y en los hablantes de español. movimiento en el 
núcleo verbal 


(«The girl run out of the house»), mientras que los hispanoparlantes eligen por igual las 
expresiones con el modo en el núcleo («La niña corrió fuera de la casa») y con la dirección en 
el núcleo («La niña salió de la casa corriendo»). 

La tendencia en inglés es clara a favor de incluir el modo en el núcleo del verbo, pero el caso 
de las expresiones de movimiento en español es más matizado, ya que también se pueden 
utilizar verbos de movimiento con el modo incorporado en el núcleo verbal. Esto puede 
ocurrir, según Slobin (1996), en los contenidos de movimiento con carácter propositivo, es 
decir, los que culminan con un resultado o meta previsible. Por ejemplo, es muy natural en 
español decir «el hombre saltó hacia la acera» o «el estudiante corrió hacia el tren». No 
obstante, está claro que en inglés el modo de movimiento se incorpora en el núcleo verbal con 
mucha más frecuencia que en español. Pero ¿qué impacto tienen estas diferencias en el modo 
de pensar sobre escenas de movimiento? ¿Acaso prestan los angloparlantes más atención a los 
movimientos corporales de los personajes, mientras que los hispanoparlantes piensan más en 
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trayectorias de movimiento? Slobin (2003) estudió las traducciones de novelas del español al 
inglés, y del inglés al español y observó que las expresiones de modo inglesas tienden a 
traducirse al español como expresiones de dirección, y las expresiones de dirección en español 
suelen traducirse como expresiones de modo al inglés. Estas «inexactitudes» indican que a los 
hablantes de una y otra lengua les cuesta mucho cambiar el foco semántico inducido por su 
gramática. He aquí algunos ejemplos: 

Inglés a español 

Original inglés: He stomped from the trim house [...]. 

Traducción literal: El pisoteó fuerte fuera de la pulcra casa [...]. 

Traducción final: El salió de la pulcra casa [...]. 

Español a inglés 

Original español: [...] luego de diez minutos de asfixia y empujones, llegamos al pasillo de la 
entrada. 

Traducción literal: [...] after ten minutes of asphyxiation and pushes, we arrived at the entry 
way. 

Traducción final: [...] after ten minutes of nearly beings mothered or crushed to death, we 
finally fought our way to the exit. 

Traducción desde la versión inglesa: [...] luego de diez minutos a punto de ser asfixiados y 
machacados hasta la muerte, finalmente luchamos por alcanzar la salida. 18 
Slobin (2003) comprobó que incluso cuando los lectores ingleses y españoles reciben 
exactamente el mismo texto traducido literalmente de una lengua a otra, ambos grupos de 
lectores se imaginan la escena descrita de forma diferente. Uno de los textos originales era el 
siguiente: 

Tomó sus maletas y echó a andar por el barrial y las piedras de un sendero que conducía al 
pueblo. Caminó más de diez minutos, agradecido de que no lloviera, porque a duras penas 
podía avanzar con sus pesadas maletas por ese camino y comprendió que la lluvia lo habría 
convertido en pocos segundos en un lodazal intransitable. 

Casi todos los hablantes de inglés describieron sus imágenes mentales de la escena, 
enfatizando los movimientos del protagonista con gran detalle, empleando verbos de modo 
que no estaban en el texto original, como tambalearse ('stagger'”), tropezar ('stumble”), caminar 
trabajosamente ('trudge”), etc. En cambio, los hablantes de español, procedentes de México, 
Chile y España, apenas utilizaron verbos de modo, aunque fueron capaces de describir 
imágenes detalladas del camino cenagoso y lleno de piedras y de los alrededores físicos de la 
escena. Los ingleses habían construido imágenes mentales del protagonista en movimiento, 
mientras que los españoles generaron imágenes estáticas, más parecidas a fotografías. Un 
estudio complementario con bilingúes inglés-español mostró que los mismos individuos 
cuando leen en inglés generan más imágenes del modo de movimiento y menos sobre el 
entorno físico que cuando leen en español. Esto sugiere que el efecto de filtro conceptual de la 
lengua es bastante local, estando circunscrito al uso momentáneo de una lengua u otra. En 
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otras palabras, los bilingúes «piensan» de modo diferente cuando se instalan en el inglés o en 
el español, debido a los imperativos gramaticales de ambas lenguas. 

Términos espaciales en diferentes lenguas 

La cognición espacial es un dominio de conocimiento que compartimos con muchas especies 
animales, dado el valor biológico que tienen la orientación y el desplazamiento en entornos 
complejos. Muchos mamíferos, aves, peces e incluso insectos tienen unas destrezas espaciales 
equivalentes y aun superiores a las humanas. Sin embargo, con la relativa excepción de la 
comunicación de las abejas sobre la posición de los campos de flores, sólo los seres humanos 
nos comunicamos de forma flexible sobre la posición relativa de los objetos en el entorno o 
sobre las rutas que conducen a metas. Precisamente el dominio de las relaciones espaciales ha 
dado lugar a gran número de investigaciones sobre la relatividad lingúística. 

Preposiciones de soporte en español y en inglés 

En todos los idiomas hay preposiciones que se utilizan para indicar la posición espacial de un 
objeto respecto a otro, pero hay importantes diferencias, tanto cuantitativas como cualitativas, 
en los repertorios de dichas preposiciones. Melissa Bowerman (1996), por ejemplo, comparó 
las preposiciones espaciales que indican contacto vertical o soporte entre objetos en varias 
lenguas, entre ellas el español y el inglés, y le llamó la atención el hecho de que en inglés se 
utilizan dos preposiciones 'in y 'on', mientras que en español basta con una: «en». Así, en 
inglés, la expresión de una relación de contacto superficial requiere on' (p. ej., «the book is on 
the table»), mientras que la relación de contacto contenido-contenedor requiere 'in' (p. ej., «the 
coflfee is in the cup»). En español, en cambio, ambas relaciones se pueden expresar con la 
misma preposición «en» (p. ej., «el libro está en la mesa/el café está en la taza»). Otras 
lenguas, como el holandés, disponen de repertorios de preposiciones de contacto con tres 
categorías, al incluir una preposición ('aan') para referirse a contacto sobre una superficie 
vertical (Fig. 4-4). 


LOS 


Inglés Español Holandés 


Figura 4-4. Clasificación de las relaciones espaciales de contacto superficial derivadas de los repertorios de pre- 
posiciones espaciales en español, inglés y holandés (Bowerman, 1996). 


Bowerman interpreta que los hablantes de español, inglés y holandés clasifican las relaciones 
espaciales de modo diferente, según una, dos o tres categorías, respectivamente, como sugiere 
la figura 4-4. Sin embargo, hay que aclarar que la figura no refleja el resultado de una tarea 
clasificatoria realizada por hablantes de estas tres lenguas, sino que corresponde a las 
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categorías descriptivas que Bowerman establece teóricamente a partir de los repertorios de 
preposiciones disponibles. En otras palabras, no está claro que los procesos de categorización 
de las relaciones espaciales sean diferentes en los hablantes de las tres lenguas o, al menos, no 
se ha verificado la hipótesis directamente. Por otra parte, no deja de ser algo sesgada la 
selección de términos espaciales que realiza la autora, ya que en español hay otras 
preposiciones que pueden precisar las relaciones espaciales de contacto; por ejemplo, «el libro 
está sobre la caja» (contacto sobre la superficie de la caja), frente a «el libro está dentro de la 
caja» (relación contenido-contenedor). 

Comunicación de la posición de un objeto con gestos y con lenguaje 

Sin duda, la línea de investigación más importante se refiere a las diferencias lingitísticas en el 
modo de expresar las direcciones espaciales en el plano horizontal. En español se emplean 
«delante», «detrás», «a la derecha» y «a la izquierda» para expresar la posición relativa de un 
objeto respecto a un marco de referencia, y en la mayoría de las lenguas indoeuropeas existen 
términos equivalentes. Estos términos obligan al hablante a realizar una segmentación del 
espacio que es diferente a la que efectuamos en la interacción habitual con el medio. 
Consideremos una situación familiar. Se nos acerca un forastero en una calle de nuestra ciudad 
y nos pregunta sobre la dirección de un lugar determinado, por ejemplo, un restaurante. Si el 
restaurante es visible en la propia calle desde el punto de vista de los interlocutores, es 
probable que simplemente señalemos con el dedo, quizás añadiendo algún término deíctico 
como «ése es», «ahí está» o «aquel edificio», etc. La comunicación mediante el gesto de 
señalamiento es una forma preverbal de localización espacial que aparece muy tempranamente 
en el niño (hacia el año de vida) como un precursor del lenguaje y que está ausente en otras 
especies primates (Tomasello, 2008). Ahora, imaginemos una situación un poco diferente: el 
restaurante por el que nos pregunta el forastero está en la misma calle, pero no es visible desde 
nuestro punto de vista. En este caso, la comunicación verbal sobre su localización es más 
compleja. Lo habitual es que elijamos otro objeto bien visible que sirva de marco de referencia 
para localizar el restaurante. Por ejemplo, en la misma calle resultan visibles una fuente, el 
edificio de un banco y una iglesia. Tras pensarlo unos segundos decidimos que la iglesia es un 
buen marco de referencia y expresamos una relación direccional entre el objeto y el marco. Por 
ejemplo, podríamos decir: «el restaurante está detrás de la iglesia». 

El gesto de señalamiento es básicamente una actividad visuomotora que consiste en alinear la 
mano y el dedo directamente con el objeto crítico. En cambio, el uso de expresiones 
direccionales supone procesos de cómputo mucho más elaborados. En primer lugar, nos obliga 
a establecer una relación direccional entre el objeto crítico y un marco de referencia. La 
elección del marco de referencia no es una decisión trivial, pues entre los muchos objetos del 
entorno algunos son más apropiados (visualmente salientes, grandes, estáticos, etc.) que otros 
(Talmy, 2000; Landau y Jackendoff, 1993; de Vega y Rodrigo, 2001). Por ejemplo, es más 
razonable decir «el libro está sobre la mesa» que «la mesa está bajo el libro» o «la bicicleta está 
frente a la iglesia» que «la iglesia está frente a la bicicleta». Una vez seleccionado el marco de 
referencia, debemos segmentar el espacio a su alrededor en regiones topológicas (frente, 
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detrás, derecha, izquierda), situar el objeto de referencia en una de esas regiones y, finalmente, 
construir la expresión direccional correspondiente. 

En algunos experimentos se demostró que, en efecto, la comunicación verbal sobre la 
localización espacial utiliza recursos cognitivos diferentes que la comunicación no verbal. Un 
grupo de participantes debía localizar objetos ocultos cuya posición había sido previamente 
aprendida, mediante el gesto de señalamiento o bien utilizando los términos direccionales 
frente, detrás, derecha e izquierda. Para obligar a los participantes a actualizar la situación 
espacial, periódicamente debían girar su cuerpo físicamente (girando su silla) para encarar uno 
de los objetos ocultos (rotación física), o bien debían imaginarse a si mismos girando hacia 
uno de los objetos ocultos (rotación imaginaria), aunque de hecho permaneciesen en la misma 
posición. Desde la nueva posición, real o imaginaria, debían localizar los objetos señalando o 
utilizando las direcciones verbales. Los resultados mostraron que el señalamiento era muy 
eficiente tras realizar una rotación física (respuestas rápidas y precisas), pero se deterioraba en 
la condición de rotación imaginaria; es decir, aumentaba el tiempo de respuesta y los errores. 
Por el contrario, cuando se utilizaban los términos direccionales para localizar los objetos 
ocultos, el rendimiento de los participantes fue igualmente bueno en el giro físico y en el giro 
imaginario (de Vega y Rodrigo, 2001; Avraamides, 2003; Wraga, 2003). La explicación es 
que el señalamiento se basa en un mecanismo propioceptivo muy básico, el mismo que nos 
permite desplazarnos en el entorno perceptivo, actualizando de forma continua y automática la 
posición de los objetos a nuestro alrededor. Esto explicaría por qué el señalamiento es tan fácil 
en la condición de giro físico, y también por qué es tan difícil en la situación de giro 
imaginario. En este último caso, se les pide a los participantes que supriman la información 
propioceptiva dominante y se basen en un marco imaginario, con el consiguiente conflicto. Lo 
más importante es que en la comunicación verbal con términos direccionales este conflicto no 
ocurre, lo cual indica que las representaciones espaciales derivadas del lenguaje se producen 
en un plano puramente representacional y están desligadas de la información propioceptiva 
inmediata. 

Las lenguas imponen un punto de vista 

Adviértase que el uso de los términos direccionales implican un punto de vista egocéntrico o 
relativo, ya que la dirección indicada depende no sólo de la posición intrínseca de un objeto 


respecto a otro, sino que también tiene en cuenta la posición del hablante en la escena, como 


ilustra la figura 4-5. 

En efecto, en la figura 4-5 A el observador describiría la 
posición del tenedor diciendo «el tenedor está a la izquierda 
de la cuchara», mientras que en la figura 4-5 B tendría que 
decir «el tenedor está a la derecha de la cuchara». Las 
expresiones egocéntricas son útiles en contextos de 
A B comunicación cara a cara, puesto que se anclan en el propio 


Figura 4-5. Relación espacial entre dos objetos, con punto de vista del hablante, aunque a veces hay cierta 
dos puntos de vista diferentes. (Véase la explicación 


en el texto.) ambigúedad, ya que la derecha o la izquierda podrían 
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también referirse al punto de vista del interlocutor que puede estar enfrente del que habla. 
Sin embargo, no todas las lenguas utilizan marcos de referencia egocéntricos. Algunas lenguas 
emplean direcciones absolutas o halo-céntricas para describir las relaciones espaciales. Los 
hablantes de una lengua halocéntrica describirían la situación A y la situación B de la figura 
4-5 exactamente igual: «el tenedor está al norte de la cuchara», es decir basándose en un 
sistema de referencia absoluto, independiente del punto de vista del hablante. Incluso hay 
lenguas que describen las relaciones espaciales de forma intrínseca, en relación con caracte- 
rísticas del propio objeto que sirve de marco de referencia. En estas lenguas se diría algo así 
como «el tenedor está en la nariz de la cuchara». En realidad, las tres formas de perspectiva es- 
pacial pueden expresarse en español. Por ejemplo, solemos utilizar una referencia halocéntrica 
para referirnos a localizaciones geográficas (p. ej., Guadarrama está al norte de Madrid), y en 
ocasiones acudimos a localizaciones intrínsecas cuando el marco de referencia tiene regiones 
distintivas, por ejemplo, al decir «el gato está detrás del coche» para referirnos a la parte de 
atrás del coche, ya que un coche tiene un delante, un detrás, una derecha y una izquierda 
distintivas. No obstante, en la mayoría de las ocasiones nuestra lengua codifica el espacio de 
forma egocéntrica. 
Stephen Levinson y sus colegas del Instituto Max Planck de Psicolingúística en Nijmegen 
(Holanda) desarrollaron un amplio programa de investigación sobre la cognición espacial y 
compararon participantes holandeses y de otros países que, como los españoles, tienen un 
lenguaje egocéntrico y participantes que utilizan lenguas halocéntricas, como el tzeltal de los 
mayas o el guuguyimithirr de los aborígenes australianos. Una de las tareas consistía en 
recordar la posición de un objeto visto 
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con su cuerpo, es decir la más próxima a ellos, 
mientras que los tzeltal elegían casi siempre la 
ficha que tenía la misma posición absoluta en la 


Solución 


iu mesa. En otro experimento, los participantes 


A vol e debían recordar un trayecto visto con anteriori- 


Figura 4-6. Estudios comparados entre hablantes de dad, como se muestra en la figura 4-6 B. En la 
una lengua egocéntrica (holandés) y hablantes de una mesa 1 el experimentador movía con la mano un 
lengua halocéntrica (tzeltal). A) Tarea de recuerdo de Ñ o O ' 
objeto. B) Tarea de recuerdo de trayecto. (Véase la ex-— muñeco de plástico, siguiendo una trayectoria. 


paolo Seguidamente, el individuo giraba hacia la mesa 
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2, donde aparecían un laberinto y un punto de partida, desde donde debía reproducir la 
trayectoria que había seguido el muñeco. De nuevo, los holandeses eligieron la solución 
egocéntrica (relativa al propio observador), y los tzeltal, la solución absoluta. 

En suma, el tipo de marco de referencia propiciado por la gramática determina modos 
diferentes de segmentar el espacio hasta el punto de influir sobre la memoria espacial de 
objetos y trayectorias. Lo más importante es que en ninguna de estas tareas los participantes 
debían comunicar verbalmente su respuesta, y aun así los holandeses y los mayas utilizaron los 
marcos de referencia inducidos por su lengua. Los hábitos de codificación lingúística del 
espacio trascienden al propio uso del lenguaje. Los experimentos de Levinson son 
convincentes y apoyan una interpretación whorfiana fuerte, aunque puede subsistir cierto 
margen de duda, dado que las tareas que afrontaban los participantes no eran totalmente libres 
de lenguaje. Al dar las instrucciones, Levinson evitaba en lo posible cualquier información 
espacial; por ejemplo: «señala el objeto que has visto antes», «repite el trayecto que has visto 
antes», «recuerda tal como es», etc. Sin embargo, se trataba de un entorno de comunicación 
verbal, en el que los participantes tenían que «entender» las instrucciones, y es posible que los 
holandeses y los mayas entendiesen algo diferente a partir de las instrucciones supuestamente 
neutras. 

El subjuntivo y el pensamiento hipotético 

«Si yo hubiera tenido una moto, habría llegado a tiempo a la reunión.» La frase anterior es una 
expresión contrafactual. En cierto modo se parece a una negación, ya que se refiere a si- 
tuaciones inexistentes, que son contrarias a los hechos reales (yo no tenía una moto y no llegué 
a tiempo a la reunión); pero, a diferencia de la negación, la expresión contrafactual invita al 
oyente/lector a considerar la posibilidad alternativa (yo tenía una moto y llegué a tiempo a la 
reunión). Gracias a la expresión contrafactual podemos conjeturar y explorar posibilidades 
alternativas a las reales, con todas las ventajas que ello implica: aprender de los errores, 
comprender mejor las relaciones causales, ponerse en el punto de vista de otros, etc. La frase 
anterior, sin embargo, no se puede decir así en chino mandarín porque no existe el modo 
subjuntivo en esa lengua. Sus hablantes deben recurrir a circunloquios del tipo de: «yo no tenía 
moto, pero si tengo moto...». Algunos lingúistas se han preguntado si esto podría tener 
consecuencias cognitivas generales: quizá los chinos tengan dificultades no sólo para expresar 
sino también para pensar en situaciones hipotéticas o contrajactuales. El psicolingiista Alfred 
Bloom (1981) dio a leer a voluntarios norteamericanos y chinos historias escritas en sus 
respectivas lenguas donde aparecían mezcladas situaciones reales y situaciones 
contrafactuales, así como sus consecuencias. Después les preguntaba si estas consecuencias 
habían ocurrido realmente, y las respuestas indicaron que, mientras los norteamericanos 
acertaban sin problemas, los chinos tenían dificultades para identificar algunas de ellas como 
hipotéticas. A partir de aquí, Bloom extrapoló la exagerada conclusión de que la lengua china 
causaba que sus hablantes fueran incapaces de concebir mundos hipotéticos, excepto a costa 
de un gran esfuerzo mental. Como cabía esperar, esto provocó una inmediata reacción en la 
comunidad científica. Sus trabajos recibieron críticas metodológicas porque había utilizado 
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textos con un chino rebuscado, poco habitual, en historias conceptualmente ambiguas. Una 
vez subsanados estos errores, las diferencias entre los grupos de sujetos desaparecieron, como 
revelaron unos experimentos posteriores efectuados por Au (1983) y Liu (1985), de manera 
independiente entre sí. 
Más tarde, Yeh y Gentner (2005) desarrollaron un estudio experimental en el que hallaron 
sutiles diferencias entre chinos y norteamericanos, dependiendo de si la condición contra- 
factual era general, independiente de cualquier contexto (p. ej., «si los antibióticos no se hu- 
bieran inventado...»), o específica, dependiente del contexto («si Michel hubiera salido con su 
novia esa noche...»). Parece que, en el segundo caso, los lectores chinos necesitan algo más de 
tiempo y atención al contexto para distinguir las situaciones reales de las hipotéticas, al carecer 
de marcadores explícitos para ello. Esto, por supuesto, no abona la versión fuerte del 
determinismo lingúiístico, puesto que las personas chinas pueden razonar perfectamente en 
términos hipotéticos, pero sí una versión débil: la ausencia de pistas lingúísticas obliga a un 
procesamiento más activo, cognitivamente más costoso, en algunos textos contrafactuales. 

e Conclusiones 
En definitiva, algunas de las investigaciones anteriores sobre las distinciones conceptuales 
incorporadas a la gramática confirman cierto impacto del lenguaje en el pensamiento, aunque 
hay que matizar los resultados y sobre todo las interpretaciones. 
En primer lugar, la relatividad lingiística no significa que haya una barrera conceptual entre 
las lenguas. En otras palabras, el supuesto whorfiano de la intraducibilidad de algunos 
conceptos es probablemente falso. En principio se puede expresar cualquier idea en cualquier 
lengua, pero las herramientas gramaticales disponibles determinan que en algunas lenguas 
algunas ideas se puedan expresar con facilidad y, en ocasiones, con obligatoriedad, mientras 
que en otras lenguas la expresión de esas mismas ideas sea opcional y requiera recursos léxicos 
cognitivamente más costosos. Por ejemplo, volviendo a los marcadores de evidencia, en la 
lengua quechua hay tres sufijos verbales -mi indica que el hablante está convencido sobre lo 
que dice al tener la información de primera mano, -shi indica que el hablante ha obtenido la 
información de forma indirecta (p. ej., se la han contado) y -chi indica que lo que dice el 
hablante es una conjetura o hipótesis. El hablante español (o inglés) no está obligado a declarar 
el grado de evidencia de lo que dice, pero el hablante quechua sí lo está. Nosotros podemos 
decir simplemente «Luis compró una moto», mientras que en el hablante quechua tendría que 
elegir entre las tres variantes morfológicas del verbo y, por lo tanto, hacer explícita su 
valoración de la evidencia. Como hablantes de español esto podría parecemos una tarea 
innecesaria y costosa, pero para los hablantes quechua los indicadores de la evidencia están 
incorporados en la gramática y, por consiguiente, se procesan automáticamente y con bajo 
coste cognitivo. Naturalmente, también en español es posible utilizar recursos léxicos 
alternativos para expresar los grados de evidencia: «he visto que Luis compró una moto», «me 
han dicho que Luis compró una moto» o «creo que Luis compró una moto». La diferencia es 
que estas expresiones de evidencia en castellano, al no estar gramaticalizadas, son opcionales 
y requieren mayor coste cognitivo. 
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En segundo lugar, el impacto cognitivo de las diferencias gramaticales entre las lenguas es, sin 
duda, más importante que el de las diferencias léxicas. Aun cuando las diferencias de 
vocabulario en un determinado dominio, como el de los colores, pudiera tener alguna 
influencia en la percepción o clasificación de éstos, estas diferencias podrían ser fácilmente 
reversibles. Por ejemplo, se podría entrenar fácilmente a los dani de Papua-Nueva Guinea a 
ampliar su vocabulario cromático, como en efecto hizo Heider Rosch (1972) en el estudio 
mencionado anteriormente. Asimismo, cualquier occidental podría aprender con facilidad a 
discriminar diferentes tipos de nieve y ponerles un nombre, como hacen los esquimales. 
Igualmente, podemos ponernos de acuerdo para evitar los sesgos sexistas de carácter léxico, y 
hablar de «la humanidad», «la ciudadanía», «el profesorado» o «el estudiantado» en lugar de 
«el hombre», «los ciudadanos», «los profesores» o «los estudiantes», respectivamente. Por el 
contrario, las diferencias gramaticales tienen un efecto más poderoso sobre la 
conceptualización, dado que las marcas y los términos gramaticales se emplean automática y 
obligatoriamente y no están sujetas a cambios ni individuales ni colectivos. En efecto, aunque 
nos lo propusiésemos, no está a nuestro alcance incorporar o suprimir preposiciones, 
conjunciones o elementos morfológicos en nuestro idioma. Un buen ejemplo de ello es la 
dificultad práctica que supone intentar corregir los sesgos sexistas de la lengua que están 
incorporados en la gramática. Sería útil ponernos de acuerdo para incorporar un morfema 
neutro o asexuado para referirnos a colectivos humanos de forma compacta, por ejemplo «les 
ciudadanes», que abarcaría tanto a «ciudadanos» como a «ciudadanas». Pero es difícil hacerlo, 
pues la maquinaria gramatical se basa en rutinas automáticas fuertemente arraigadas en 
nuestro sistema cognitivo. Por ello, en la medida en que se constate un influjo de la gramática 
sobre el modo de pensar, este influjo será difícil de evitar. 
En tercer lugar, hay dos posiciones relativistas muy diferentes sobre el impacto de las pro- 
piedades gramaticales de la lengua en el pensamiento: 
» Los efectos de la lengua sobre el pensamiento sólo ocurren en línea, es decir, durante la 
producción o la comprensión del habla. 
» Los efectos de la lengua sobre el pensamiento tienen consecuencias más allá del acto 

del habla, determinando hábitos de pensamiento y conceptualización permanentes. 
La versión de efectos en línea es lo que Dan Slobin (1987) denomina pensar para hablar 
(thinking for speaking), y lo que Levelt (1999) llama microplanificación. Es decir, sería en el 
momento en que construimos una expresión lingúística cuando las propiedades particulares de 
nuestra gramática nos obligarían a prestar más atención a ciertos aspectos de la realidad que a 
otros. En palabras de Slobin: 

La actividad de pensar tiene una cualidad particular cuando la empleamos en la activi- 

dad de hablar. En ese marco temporal evanescente en el que construimos expresiones 

en el discurso, uno debe ajustar sus pensamientos a las formas lingúísticas disponibles. 

Una expresión particular no es nunca un reflejo de la realidad «objetiva» o percibida o 

de una representación mental universal e inevitable de la situación. Esto es evidente 

dentro de una lengua determinada, ya que la misma situación puede describirse de 
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diferentes modos, y es evidente entre diferentes lenguas, porque cada lengua 
proporciona una serie limitada de opciones para la codificación gramatical de las 
características de objetos y de eventos. «Pensar para hablar» implica elegir aquellas 
características que: a) se ajustan a cierta conceptualización del evento, y b) son 
inmediatamente codificables en la lengua (Slobin, 1987, p. 435). 
Pensar para hablar se puede entender al menos en tres sentidos. En primer lugar, un mismo 
individuo codifica de modo diferente un aspecto de la situación, dependiendo de si decide 
comunicarlo verbalmente o no. Un buen ejemplo es la comunicación sobre la localización de 
un objeto en el plano horizontal. Si empleamos el gesto de señalamiento, apenas se requieren 
procesos sensoriomotores simples, como alinear el dedo con el objeto crítico, y utilizar el 
sistema propioceptivo para actualizar la posición del objeto al movernos. En cambio, si 
decidimos comunicarnos verbalmente, debemos seleccionar un marco de referencia, 
segmentar el espacio en regiones topológicas alrededor y computar la posición del objeto 
crítico en una de estas regiones («el libro está a la derecha del teléfono»). Sería ésta una forma 
de relatividad intralingúíística, muy diferente de la relatividad whorfiana: mi lengua me obliga 
a realizar una codificación específica de la experiencia, pero sólo cuando tengo que comunicar 
dicha experiencia; en caso contrario, la codificación de la experiencia se basa en procesos no 
lingúísticos. La segunda forma de pensar para hablar es también intralingúística: podemos 
elegir entre diferentes recursos gramaticales dentro de nuestra propia lengua para expresar una 2 6 
experiencia; por ejemplo: «el libro está a la derecha del teléfono» (término direccional), «el 
libro está junto al teléfono» (término de distancia), «el libro está en la mesa» (término de 
contacto superficial), etc. Finalmente, la tercera forma de pensar para hablar concierne al 
contraste entre lenguas. Los hablantes de diferentes lenguas aplican operaciones de 
codificación distintas, guiadas por su gramática específica, cuando comunican su experiencia 
en un dominio determinado. Así, en holandés o en español describimos la localización espacial 
con un punto de vista egocéntrico, mientras que en la lengua maya tzetzal se emplea una 
perspectiva halocéntrica. 
Los adversarios de la relatividad whorfiana, como Pinker o Levelt, que defienden plantea- 
mientos universalistas del lenguaje, están dispuestos a aceptar los efectos en línea del lenguaje, 
es decir la noción de pensar para hablar propuesta por Slobin, pero más allá del momento de la 
comunicación las diferencias gramaticales no tendrían consecuencias cognitivas apreciables. 
En la posición opuesta se encuentran aquellos que aseguran que las diferencias lingúísticas 
tienen una influencia cognitiva que va más allá del momento de la comunicación, por ejemplo, 
modulando los procesos de memoria e, incluso, determinando nuestros procesos de 
pensamiento en tareas no mediatizadas por el lenguaje. En este sentido, los estudios de 
Levinson y sus colegas sobre la cognición espacial son los que ofrecen evidencias más 
concluyentes. 
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PRIORIDAD DEL PENSAMIENTO SOBRE EL LENGUAJE 
Las influencias entre pensamiento y lenguaje podrían ser mutuas, y en algunos aspectos, al 
menos, la conceptualización y el pensamiento podrían determinar decisivamente el uso de 
expresiones lingiísticas. Nos referimos al desarrollo temprano de algunos conceptos que 
precede cronológicamente a la adquisición del lenguaje, y al hecho de que algunas metáforas 
ampliamente utilizadas en la mayoría de los idiomas podrían estar determinadas por nuestro 
modo de entender la realidad. 

* Desarrollo temprano de los conceptos 
El debate clásico entre Jean Piaget y Lev Vigotsky, descrito previamente, sugiere que la 
investigación evolutiva es un campo apropiado para explorar las relaciones funcionales entre 
pensamiento y lenguaje. El debate, sin embargo, se planteó sobre el habla egocéntrica, que es 
un fenómeno que aparece alrededor de los 3 años, cuando el niño ya ha adquirido gran parte de 
las habilidades lingúísticas del adulto. Una estrategia diferente para afrontar las relaciones 
entre lenguaje y pensamiento es retrotraerse al estudio del niño preverbal y comprobar en qué 
medida hay avances en el pensamiento y la conceptualización que preceden y que podrían 
influir sobre la propia adquisición del lenguaje. 
Los trabajos del propio Piaget sobre el desarrollo cognitivo del bebé, basados en la 
observación de sus dos hijas, son relevantes. Piaget observó que, en el primer año de vida, el 
bebé desarrolla una inteligencia sensoriomotora. El niño viene equipado al nacer con un 
puñado de reflejos para producir respuestas automáticas ante ciertos estímulos; por ejemplo, el 
reflejo de succión cuando se le acerca un chupete a la boca o el reflejo de prehensión cuando se 
le coloca un lápiz en la palma de la mano. Estos reflejos, sin embargo, se acaban convirtiendo 
al cabo de los meses en esquemas sensoriomotores que le permiten al bebé explorar el mundo 
de forma activa, por ejemplo, agarrando objetos y soltándolos repetidas veces o llevándose 
objetos a la boca. De este modo, hacia los 8 meses, basándose en sus propias acciones, el bebé 
construirá la noción de objeto permanente (los objetos siguen ahí aunque estén ocultos a la 
vista), las categorías de objetos perceptivos o la causalidad (las mismas acciones producen 
idénticas consecuencias). Por ejemplo, cuando Piaget ocultaba un juguete bajo una manta, el 
bebé se desplazaba gateando y retiraba la manta para recuperarlo, indicando que la 
representación del objeto se mantiene en la memoria incluso aunque esté oculto. Hacia el año y 
medio, el niño es capaz ya de imaginar los conceptos en ausencia de los objetos, es decir como 
representaciones mentales, con lo cual accede a las operaciones simbólicas, coincidentes con 
el inicio del lenguaje. Pese a la metodología «casera» empleada por Piaget, gran parte de sus 
observaciones sobre la inteligencia sensoriomotora del niño preverbal se han confirmado y 
ampliado posteriormente. 
Las demostraciones de Piaget sobre la adquisición de los conceptos sensoriomotores 
requieren, todas ellas, un sistema motor bastante maduro: el bebé debe ser capaz de 
desplazarse en el entorno y de manipular objetos. Sin embargo, las investigaciones más 
recientes, que utilizan técnicas de observación más sofisticadas que las de Piaget, han revelado 


booksmedicos.org 


27 


Psicología del Lenguaje — TEMA 4 


que el desarrollo conceptual en el bebé preverbal empieza incluso antes de que éste haya 
desarrollado esquemas de acción. 

Cuando se presenta un tipo de estímulo visual repetidas veces a un bebé, el tiempo de 
observación que le dedica va siendo cada vez menor; en otras palabras, el bebé se habitúa o 
familiariza con el estímulo y deja de prestarle atención. Si entonces se le presenta un estímulo 
nuevo, el tiempo de observación vuelve a incrementarse, es decir que el bebé se «deshabitúa» 
y vuelve a prestar atención al estímulo. Con esta técnica es posible valorar sutilmente los 
procesos cognitivos del bebé: la deshabituación sólo ocurrirá si el niño discrimina el nuevo 
estímulo como algo diferente o anómalo, y, por lo tanto, nos dará valiosas pistas sobre sus 
procesos de categorización. Por ejemplo, Baillargon et al. (1985) aplicaron la técnica de 
habituación al estudio del objeto permanente mediante un ingenioso experimento. Los niños se 
habituaban en un primer momento a una pantalla colocada horizontalmente sobre la mesa, y 
que el experimentador hacía girar 180 de adelante atrás, apoyada sobre su borde inferior. Más 
tarde, en la fase de prueba, se colocaba un objeto (p. ej., un cubo) frente a la pantalla de modo 
que, cuando ésta estaba a la mitad del recorrido de giro (909), ocultaba totalmente el objeto. 
Luego la pantalla seguía girando con dos resultados posibles: 1) no llegaba a completar el giro 
de 180%, sugiriendo que el cubo oculto le impedía el paso, o 2) giraba 180% como si el cubo 
hubiera desaparecido. Los niños muy pequeños (4 o 5 meses) miraban mucho más tiempo en la 
situación 2 que en la situación 1, ya que en aquélla habían detectado la anomalía. Es decir, el 2 8 
niño tiene una representación del objeto permanente (el cubo oculto) -e incluso de sus pro- 
piedades físicas como la solidez-, varios meses antes de lo que había postulado Piaget. 
Basándose en los estudios de habituación, los investigadores han concluido que el bebé de 3 o 
4 meses construye conceptos fundamentales a partir del análisis perceptivo del entorno 
(Man-dler, 1992; Spelke et al., 1992; Leslie, 1984). Por ejemplo, según Jean Mandler (1992), 
el bebé elabora imágenes-esquema preverbales sobre la animacidad, la inanimacidad, la 
causalidad (Recuadro 4-2), la agencia, el soporte y el contenedor, antes de manipular los 
objetos o desplazarse en el entorno por sí mismo. Dichas imágenes-esquema no son simples 
imágenes mentales de los objetos o eventos, sino verdaderas abstracciones de algunas de sus 
propiedades más significativas. 


Las imágenes-esquema 
Recuadro 4-2. Causalidad a los 4 meses : z 
requieren un computo 


Piaget propuso que la noción de causalidad aparece bastante tarde, cuando el niño descubre complejo. Así, la animacidad 
que sus acciones producen efectos previsibles en su entorno. Sin embargo, según los estudios ; ] 
posteriores de Alan Leslie (1984), quien utilizó un paradigma de habituación, la edad de adquisi- S€  Caracteriza por varios 


ción del concepto de causalidad se adelanta a los 4 meses. . : 
1 rasgos: los objetos se mueven 
En la fase de habituación se mostraba a los bebés un vídeo en el que se veía una mano que se 


aproximaba a una muñeca rusa, la cogía y la retiraba. Posteriormente, en la fase de prueba, se «por sí mismos» no por 
mostraba a la mitad de los bebés un vídeo de contacto pero con la imagen invertida o en espejo, e 
y a la otra mitad, un vídeo parecido al original pero en el que la mano se acercaba hasta unos impulso de una fuerza física 
15 mm a la muñeca, sin llegar a establecer contacto con ella. De este modo la mano parecía dia . s 
coger y retirar la muñeca como por arte de magia. visible, siguen trayectorias 


El primer grupo, de imagen en espejo, apenas aumentó el tiempo de observación del video, irregulares o no newtonianas 
a pesar de las diferencias visuales importantes respecto al vídeo de habituación. En cambio el ; . A 7% 
segundo grupo aumentó considerablemente el tiempo de observación, indicando que los bebés (p. eJ., cambian de dirección 
se sorprendían al ver una violación de la causalidad perceptiva. . h 
varias veces o se detienen y 
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vuelven a arrancar) y su comportamiento es contingente a la actividad del propio observador 
(p. ej., responden a la sonrisa). Por el contrario, los objetos inanimados sólo se mueven 
impulsados por otros o por la gravedad y siguen trayectorias newtonianas. Las 
imágenes-esquema de animacidad e inanimacidad, a su vez, están estrechamente relacionadas 
con el desarrollo de las imágenes-esquema de agencia y causalidad, respectivamente. En 
efecto, el niño abstrae el concepto de causa cuando observa los movimientos de los objetos 
inanimados, impulsados por un agente externo. En cambio, los movimientos de los objetos 
animados, incluido el propio cuerpo, le llevan a inferir la agencia como una fuerza intrínseca O 
autogenerada. Las imágenes-esquema de soporte y de contenedor se adquieren también muy 
tempranamente. Por ejemplo, los niños de 5,5 meses se sorprenden al ver que un contenedor 
sin fondo sostiene algo. 
Por su parte, Elisabeth Spelke asegura que el bebé preverbal adquiere un núcleo de conoci- 
mientos (core knowledge) que incluye la representación de las propiedades físicas y 
mecánicas de los objetos, la cantidad y las propiedades geométricas del espacio (Spelke et al., 
1992; Spelke, 2003). Por ejemplo, en relación con el concepto de numerosidad, se realizó un 
experimento con bebés de 6 meses a los que se les presentaron en la fase de habituación 
estímulos que incluían cierto número de círculos: a la mitad de los niños se les presentaron 8 
círculos, y a la otra mitad, 16 círculos. En cada ensayo se mantenía constante el número de 
círculos, pero éstos variaban en tamaño y distribución en el espacio. Cuando se produjo la 
habituación (el tiempo de observación disminuyó a la mitad), se realizó la prueba consistente 
en presentar nuevos ensayos, unas veces con el mismo número de puntos (88) y otras con 
diferente número de círculos que durante la habituación (816). Los resultados mostraron 
mayor deshabituación (aumento del tiempo de observación) en los ensayos con cambio de 
número, indicando que los bebés eran sensibles a la numerosidad. 
Sin embargo, Spelke cree que este núcleo de conocimientos no es específicamente humano, 
sino que lo compartimos con otras especies. De hecho, describe experimentos análogos a los 
de los bebés, realizados con primates e incluso con ratas, que demuestran que comparten con 
nosotros ese mismo núcleo de conocimientos. Esto no es sorprendente teniendo en cuenta el 
valor adaptativo de esos conocimientos en la mayoría de las especies estudiadas. No obstante, 
es importante recordar que se trata de conocimientos preverbales y que la adquisición posterior 
del lenguaje necesariamente debe anclarse sobre ellos. 

+ Consideraciones sobre las metáforas 
El lenguaje cotidiano está plagado de metáforas, es decir de expresiones que utilizan términos 
concretos para referirse de forma analógica a dominios más abstractos. Muchas de estas 
metáforas se refieren a conceptos sociales. Por ejemplo, «estoy atascado en este trabajo» (acti- 
vidad como contenedor), «Laura me arrastró al festival de ópera» (influencia social como 
fuerza física), «Marta escaló varios puestos en la empresa» (triunfo como movimiento 
ascendente). En opinión de los lingiiistas cognitivos, especialmente Lakoff y Johnson (1982), 
las metáforas son conceptuales; en otras palabras, nuestros conceptos son metafóricos y, como 
consecuencia, generamos y comprendemos expresiones metafóricas derivadas de esos 
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conceptos. Este sustrato conceptual metafórico explicaría que seamos capaces de entender 
expresiones metafóricas nuevas que nunca habíamos oído o leído, e incluso a veces inventar 
expresiones metafóricas que nuestros interlocutores entienden. Más aun, muchas de estas 
metáforas en el dominio social se apoyan en experiencias corpóreas que compartimos los seres 
humanos y, por lo tanto, ocurren en una gran diversidad de lenguas y culturas. A continuación 
se describen algunos tipos de metáforas que se han investigado recientemente. 

La exclusión social como dolor. Cuando una persona es ignorada o excluida por otras 
personas significativas, por ejemplo, sus amigos, sus colegas de trabajo o su pareja romántica, 
es frecuente que utilice metáforas de dolor: «has herido mis sentimientos», «me duele que me 
ignores», «su comportamiento es una puñalada en la espalda», etc. Las metáforas de exclusión 
social como dolor no son caprichosas o arbitrarias, y ocurren en idiomas de orígenes y 
distribuciones geográficas dispares, como se aprecia en la tabla 4-2. Es muy probable que estas 
metáforas tengan una motivación biológica universal. 


Tabla 4-2. Términos de dolor que se utilizan como metáforas de exclusión social en varias lenguas 


Lengua Palabra Traducción 
Alemán Blessé Herido 

Francés Gekwetst Herido 

Holandés Being hurt /broken heart Herido 

Inglés Ferito Estar herido/corazón herido 
Italiano Pligomenos Herido 

Griego He pag'ah baregashot shelo Herido 

Hebreo Megsertoedni Golpeó/daño sus sentimientos 
Húngaro Zkatsoumnires tsavtsoutsir Estar herido 

Armenio Shang liao kan ching Hieres mis sentimientos 
Mandarín Siong sum Sentimientos heridos 
Cantonés Snying la phog Corazón herido 

Tibetano Sems lu phog Golpear el corazón 

Butanés Annigtuq Golpear la mente 

Inuktitut Verletzt sein Herir con duras palabras 


Adaptado de MacDonald y Leary, 2005. 


La exclusión social como temperatura. La exclusión y la inclusión sociales también se 
expresan en términos de temperatura en muchos idiomas. Por ejemplo, expresiones de 
exclusión serían «me trató con mucha frialdad», «las relaciones entre Luis y Marta se han 
enfriado», etc., y en la vertiente de la inclusión: «me acogió calurosamente en su casa», «me 
sonrió cálidamente», etc. De nuevo vemos en estas expresiones metafóricas una 
fundamentación biológica que probablemente sea universal. En una investigación realizada 
por Zhong y Leonardelli (2008) se pidió a algunos participantes que recordasen una situación 
en la que se habían sentido excluidos o rechazados, mientras que a otros se les solicitó que 
recordasen una situación en la que habían sido aceptados o incluidos. Posteriormente se les 
pidió que calculasen la temperatura de la sala experimental (idéntica en todos los casos); los 
resultados mostraron que el grupo de recuerdo de exclusión estimaba una temperatura 5 *C 
inferior a la estimada por el grupo de recuerdo de inclusión. En otro experimento, se indujo 
exclusión social en un grupo de participantes mediante el mismo juego de pelota que se 
describe en el recuadro 4-3; un grupo de control participaba en el mismo juego pero sin 
exclusión. Posteriormente se pidió a todos que juzgasen qué bebidas les apetecían más. Los 
resultados mostraron que el grupo excluido puntuaba significativamente más deseables las 


booksmedicos.org 


30 


Psicología del Lenguaje — TEMA 4 


bebidas calientes (café, sopa) que el grupo de control. Por si hubiera dudas, los individuos 
sometidos a situaciones de exclusión social experimentan un descenso significativo en la 
temperatura corporal, medida en sus dedos (Ijzerman et al., 2012). Incluso hay evidencia de 
que sostener en las manos un objeto caliente nos predispone a mostrarnos más «cálidos» y 
afectuosos con los demás (Williams y Bargh, 2008 En suma, las metáforas de temperatura 
tienen una raíz fisiológica indudable. 


Recuadro 4-3. El dolor de exclusión social en el cerebro 


Recientemente, la neurocientífica Naomi Eisenberger estudió la actividad cerebral asociada a 
la exclusión social (Eisenberger et al., 2003; Eisenberger, 2012). Se sabe que hay dos componen- 
tes neuronales relacionados con el dolor físico: un circuito sensorial, que codifica la sensación del 
dolor y su localización corporal, y un circuito afectivo (cingulo anterior, amigdala), responsable 
del sentimiento desagradable (sufrimiento, malestar) que acompaña al dolor. Eisenberger y sus 
colaboradores idearon un procedimiento para generar exclusión social, mientras se registraba la 
actividad cerebral de los participantes. Estos debían participar en un videojuego consistente en 
pasarse la pelota con otros dos jugadores, que ellos creían manejados por personas reales, pero 
que en realidad estaban controlados por un programa de ordenador. En una primera ronda de 
juego los falsos jugadores le pasaban la pelota al participante (inclusión), pero en la segunda 
ronda sólo se pasaban la pelota entre ellos (exclusión), como se aprecia en la figura 4-7. 


Exclusión 
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Figura 4-7. Fotogramas del experimento de Eisenberger et al. (2003), correspondientes a la situación de 
inclusión y de exclusión social. 


Cuando se comparó la situación de exclusión con 
la de inclusión, se observó un incremento de la acti- 
vación en la corteza cingulada anterior y en la ínsula 
inferior, es decir, en el circuito afectivo del dolor (Fig. 
4-8). 


Como asegura Eisenberger (2012, p. 3): 


Figura 4-8. Activaciones en la corteza cin- 
gulada anterior (CCA) y en la ínsula inferior 
(Al) durante la situación de exclusión social. 


Desde una perspectiva evolucionista, la idea de que la 
ausencia de vínculos sociales es «dolorosa» tiene mucho 
sentido. Los humanos, como especie mamífera, nacen re- 
lativamente inmaduros, sin capacidad de alimentarse o de- 
fenderse por sí mismos y por tanto dependiendo casi totalmente del cuidado y alimentación proporcionados 
por otros. Debido a este largo periodo de inmadurez de los mamiferos, el sistema de apego social -que 
promueve vínculos sociales- puede haberse asentado sobre el sistema del dolor físico, reutilizando el propio 
sistema de señales del dolor para indicar cuando las relaciones sociales están amenazadas y promoviendo 
así la supervivencia. En otras palabras, en la medida en que la separación del cuidador sea una amenaza 
para la supervivencia, la experiencia de ser «lastimado» por la separación social sería un modo adaptativo 
de prevenirla. 


La indignación moral como asco. Referimos sentimientos de asco causados por sabores y 
olores desagradables o por la visión de las cucarachas. El asco es una reacción emocional muy 
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primaria, con una expresión facial característica, y con un claro valor adaptativo: nos evita 
ingerir sustancias u objetos potencialmente nocivos. Pero también empleamos términos como 
«asco», «repugnancia» o «mal sabor de boca» para referirnos metafóricamente a los 
sentimientos que provocan los comportamientos inmorales, como los actos terroristas, el 
incesto, la corrupción política, la cobardía o la conducta desleal. Estas metáforas parecen 
basarse en el hecho de que tanto el asco como la indignación moral podrían tener el mismo 
sustrato fisiológico y neurológico. Por ejemplo, Chapman et al. (2009) registraron las 
expresiones faciales de los participantes cuando se les pedía que probasen sabores 
desagradables, cuando veían fotografías de sustancias repugnantes o cuando participaban en 
un juego de reparto de monedas en el que el contrincante se comportaba de forma desleal 
(adjudicaba al participante una cantidad mínima y se quedaba con el resto). En las tres 
situaciones los participantes mostraban la expresión facial del asco, contrayendo la región del 
músculo elevador del labio característica de la respuesta oral-nasal de rechazo. 
La culpa como suciedad. El sentimiento de culpa se experimenta a veces como suciedad y, en 
contrapartida, la limpieza corporal puede asociarse a la liberación de la culpa. En la tragedia 
Macbeth de Shakespeare, lady Macbeth que ha sido cómplice de su cuñado en el asesinato de 
su marido, enloquece por el sentimiento de culpa y comienza a lavarse las manos 
compulsivamente. En el Nuevo Testamento se menciona que el gobernador romano Poncio 
Pilatos se lava las manos como gesto para liberarse de la responsabilidad y de la culpa de la 3 Z 
condena de Jesucristo. En muchas religiones hay ritos de limpieza o purificación, como 
lavarse las manos o bañarse. Por ejemplo, el bautismo en los cristianos como forma de 
liberarse del pecado, pero también entre los musulmanes o los hindúes hay ritos de limpieza 
corporal, que tienen por finalidad la purificación espiritual. Investigaciones recientes han 
constatado que estas metáforas de culpa como suciedad y de purificación como limpieza 
tienen una motivación psicológica. Así, en un experimento, Zhong y Liljenquist (2006) 
pidieron a los participantes que copiasen una narración en la que el personaje tenía un 
comportamiento moral (ayudar a un compañero de trabajo) o inmoral (sabotear el trabajo de 
un compañero). Posteriormente, los sujetos juzgaban la deseabilidad de una serie de productos 
de limpieza (gel de baño, detergente, jabón, etc.) o de otro tipo (refresco, batería, donut, etc.). 
Los participantes que habían copiado la historia inmoral juzgaron significativamente más 
deseables los productos de limpieza que los sujetos que habían copiado la historia moral. 

* Conclusión 
En conclusión, el desarrollo de un conjunto de conocimientos y conceptos fundamentales 
precede a la adquisición del lenguaje en los niños. Sin una codificación básica de los objetos 
animados e inanimados, las relaciones espaciales, las acciones, las relaciones causales, la 
numerosidad, etc., no es posible que el niño descubra la referencialidad de las palabras y la 
combinatoria gramatical. Los conceptos básicos son las «perchas» sobre las que se cuelgan las 
primeras palabras y estructuras gramaticales. Así, el uso de las preposiciones que indican 
relaciones de soporte y de contenedor no sería posible si antes el niño no dispusiera de las 
imágenes-esquema correspondientes a partir de su experiencia perceptiva y motora. De hecho, 
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el niño adquiere estas imágenes-esquema, al menos, un año antes de que comience a utilizar 
las preposiciones. El descubrimiento temprano de estos conceptos es universal, de modo que 
este hecho resta importancia a las supuestas diferencias interlingúísticas en la clasificación de 
las relaciones espaciales que postula Bowerman. Obviamente, los hispanohablantes son tan 
capaces como los angloparlantes de clasificar relaciones de soporte/contenido, con 
independencia de que en nuestra lengua tengamos una preposición de uso dual (en), en lugar 
de dos (£in/on). 

Por otra parte, los estudios sobre algunas metáforas en el dominio social no ponen de 
manifiesto una relatividad lingúística, sino más bien la existencia de un determinismo 
conceptual, al sugerir que algunos conceptos metafóricos -probablemente universales- 
determinan expresiones metafóricas, y no a la inversa. La cadena causal sería la siguiente: 
sustrato fisiológico y neuronal compartido entre un dominio biológico y otro social —= 
conceptualización metafórica —> expresión metafórica. 


RESUMEN 


+ El estudio de las relaciones funcionales entre pensamiento y lenguaje, dos rasgos 
cognitivos característicos de la especie humana, es un tema clásico de la filosofía y de 
la psicología. Por ejemplo, dio lugar a un debate entre Vigotsky y Piaget, los dos 
grandes pioneros de la psicología evolutiva. 

+ Una propuesta que ha tenido gran influencia es la de la relatividad lingiiística o 
hipótesis whor-fiana. Según ésta, las diferencias léxicas y gramaticales entre las 
lenguas determinan modos diferentes de conceptualizar y de pensar. Los primeros 
intentos de verificar la hipótesis compararon la categorización de los colores entre 
individuos cuyas lenguas diferían en la riqueza del vocabulario cromático; los 
resultados fueron generalmente desfavorables a la relatividad: la categorización de los 
colores es universal e independiente de las lenguas. 

» Los estudios neowhorfianos más recientes se centran en las diferencias gramaticales, 
que inducen sesgos en la codificación de ciertos parámetros, como el tiempo, el 
espacio, la evidencia, el movimiento, etc. El debate se plantea hoy en día sobre si las 
diferencias gramaticales influyen sobre la conceptualización sólo en el momento de la 
comunicación lingúística, como defiende Slobin (pensar para hablar), o si los efectos 
sobre la conceptualización ocurren de forma permanente, como sugiere Levinson. 

+ Algunos estudios sobre la verbalización de relaciones espaciales indican que las 
diferencias gramaticales entre las lenguas influyen en la codificación del espacio 
incluso en tareas no lingiísticas; otros estudios, sin embargo, sugieren que los efectos 
son mucho más locales y ocurren en línea en el momento de la comunicación. 

» Otras líneas de investigación muestran influencias en dirección opuesta: el 
pensamiento puede determinar o modular el uso del lenguaje. El desarrollo cognitivo 
de los bebés muestra claramente que varios conceptos fundamentales (objeto 
permanente, animacidad, no animacidad, relaciones espaciales de soporte y 
contenedor, numerosidad, causalidad, etc.) se consolidan a los pocos meses de vida, 
mucho antes del desarrollo del lenguaje. En los adultos algunas metáforas en el 
dominio social son conceptuales y universales y preceden y determinan la construcción 
de expresiones metafóricas. 
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Preguntas de reflexión 
+ Explica las diferencias entre Piaget y Vigotsky en la interpretación del habla 


egocéntrica. 

+ ¿Por qué razón las diferencias léxicas entre lenguas no son concluyentes para la 
hipótesis de la relatividad lingúística? 

+ ¿Qué consecuencias cognitivas puede tener el uso de una lengua egocéntrica o una 
halocéntrica? 

+ Explica la noción de pensar para hablar y su relevancia para la hipótesis whorfiana. 

+ ¿Cómo funciona la técnica de habituación en el estudio del desarrollo temprano? 

+ Explica la metáfora de exclusión social como dolor. 
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Objetivos de aprendizaje 
Al finalizar el capítulo el alumno será capaz de: 
e Describir las principales características acústicas del habla y sus procedimientos de 
análisis 
e Conocer las propiedades generales de la percepción del habla en relación con la 
percepción de los sonidos en general. 
e Entender la dificultad que entraña la ausencia de varianza acústica para percibir 
fonemas estables desde una señal sumamente variable. 
e Explicar los mecanismos básicos de la percepción de vocales y consonantes 
e Interpretar las explicaciones de las principales teorías de la percepción del habla. 
e Razonar las consecuencias teóricas de los experimentos de percepción del habla por 
animales y los experimentos con sonidos de no-habla. 
e Evaluar la importancia del contexto en la percepción del lenguaje. 


INTRODUCCIÓN 

Abordar el estudio del lenguaje oral desde el punto de vista material, de su realización física 
o acústica, es referirse al habla; por lo que en este capítulo emplearemos los términos 
lenguaje o habla humana de forma indistinta. Lo primero que no hay que olvidar es que el 
habla es sonido y, por consiguiente, participará de todas sus propiedades. Para entender esto, 
hemos de hacer previamente un rápido repaso de las principales características del sonido. 

El sonido se produce cuando un cuerpo vibra y comunica la vibración a las moléculas del 
entorno (aire, agua) y esta energía es recibida por el oído. En el vacío no puede oírse el 
sonido porque faltan las moléculas que transportan la energía vibratoria. Cuando una piedra 
cae en un estanque de agua, se forman ondas concéntricas que se expanden a través de la 
superficie tranquila. Si observamos qué ocurre con un corcho de pesca o cualquier otro 
objeto flotante, vemos que se mueve arriba y abajo, pero no se desplaza en sentido lateral. Lo 
que se desplaza realmente es la onda, la energía ondulatoria; las moléculas individuales sólo 
se mueven localmente y comunican el movimiento a las vecinas. 

Cuando un objeto vibra en el aire, ocurre algo parecido, pero debemos imaginar la onda en 
tres dimensiones: como esferas concéntricas que se expanden desde el punto de la vibración. 
Nuestro cerebro es una maquinaria biológica que, entre otras cosas extrañas y maravillosas, 
tiene la capacidad de extraer significados a partir de estos movimientos moleculares. En ese 
movimiento vibratorio u ondulatorio, las moléculas se acercan y se separan entre sí, 
transmitiendo las sacudidas de unas a otras. Podemos representar dicho movimiento 
mediante una onda, o línea ondulante que sube y baja formando picos y valles. Los picos 
corresponderían a los momentos en que hay una presión positiva y las moléculas se juntan, y 
los valles, a los momentos de presión negativa, en los que las moléculas se separan. 
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Las piezas básicas del sonido son las ondas puras o simples, que no pueden descomponerse 
en ninguna otra. Una onda comprende una sucesión de ciclos o patrones de vibración que se 
repiten en el tiempo, y cada ciclo está formado por un pico que sube y un valle que baja en 
torno a un punto central de energía cero (Fig. 5-1). 

: na Dependiendo de la velocidad de vibración, las ondas 


varían en el número de ciclos que caben en un segundo, 
dando lugar a la dimensión o variable frecuencia. Las 
| O ondas que nacen de movimientos vibratorios rápidos, 
ATAR E - tienen una frecuencia alta, con muchos ciclos por 
Figura 5-1. Onda pura o simple. Se han marcado un B E 

ciclo y la amplitud entre un pico y un valle. La línea segundo (o hercios) y se perciben como agudas. Las 


central corresponde a energía cero. 


O 4 ve ¿ Amplitud 


ondas que nacen de movimientos vibratorios lentos, 
tienen una frecuencia baja, con pocos ciclos por segundo y se perciben como graves. Cada 
objeto sólido tiene una frecuencia de vibración característica; en igualdad de condiciones un 
cuerpo largo vibrará más lentamente que uno corto. Así sucede, por ejemplo, con las cuerdas 
de una guitarra: cuanto más corta es la parte libre dejada por los dedos contra el mástil, más 
rápido vibra y más agudo es el sonido; cuanto más larga, más lenta es la vibración y suena 
más grave. En los seres humanos, las voces masculinas son más graves porque las cuerdas 
vocales de los varones son más largas que las de las mujeres. Otra dimensión importante es 
la intensidad o amplitud del desplazamiento de la onda, entre el pico y el valle. Desde el 
punto de vista perceptivo, su unidad es el decibelio (dB), que es una medida relativa y no 
lineal que abarca desde O dB, o umbral de la audición, hasta más de 140 dB, que es el umbral 
del dolor al sonido. Una conversación normal se sitúa entre 40 y 60 dB (Recuadro 5-1). 


Recuadro 5-1. Frecuencia fundamental de la voz 

Del examen de la onda del habla se pueden extraer diferentes parámetros; el más importante 
es el número de ciclos por segundo o frecuencia fundamental de la voz o Fo. Cada persona 
tiene un valor medio característico. En general, la frecuencia fundamental es más baja en los 
varones que en las mujeres, debido a que las cuerdas vocales masculinas son más largas que 
la femeninas y, por lo tanto, vibran más despacio, generando una voz más grave. Los 
valores promedio en varones adultos se sitúan aproximadamente entre 70 y 170 ciclos por 
segundo o hercios (Hz), y en las mujeres entre 130 y 270 Hz (Baken, 2000). Cuando 
hablamos, la frecuencia fundamental de la voz sube y baja configurando la entonación 
prosódica de la frase. Hay rasgos prosódicos universales que son comunes a todas las 
lenguas del mundo, como la entonación ascendente en las preguntas o la forma de transmitir 
ciertas emociones. Hoy sabemos que la entonación desempeña un papel relevante en el 
procesamiento sintáctico, como paso necesario en los procesos de comprensión. En ciertas 
alteraciones neurológicas, como en la enfermedad de Parkinson, en algunas disartrias o en la 
muy rara del síndrome del acento extranjero, la prosodia se ve afectada y repercute 
negativamente en la inteligibilidad o en la naturalidad del lenguaje. 

La frecuencia fundamental, al ser característica de cada individuo, es como su sello o marca 
de distinción que ayuda en la identificación del hablante. Probablemente interviene en el 
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«anclaje» del sistema perceptivo del oyente sobre una voz particular, en situaciones de 
conversaciones cruzadas y simultáneas (el denominado efecto «cocktail-party»). Quizás en 
la recepción del lenguaje en condiciones naturales, la frecuencia fundamental o Fo 
desempeñe un papel importante en la individualización de la voz y ayude a evitar la 
«intrusión» de voces competidoras en el proceso perceptivo. Si en una voz se manipula 
artificialmente la frecuencia fundamental, aumentando o disminuyendo ligeramente su 
número de hercios por medios electrónicos, se obtiene un drástico efecto sobre la percepción 
de la identidad del hablante, causando la impresión de que quien habla es una persona 
distinta. 


La suma de varias ondas simples da lugar a una onda compleja. En realidad, lo que existe en 
la naturaleza son ondas complejas, pues las simples sólo se consiguen por medios 
electrónicos o con dispositivos especiales como el diapasón 

para afinar instrumentos musicales. Hay dos clases de ondas complejas: periódicas, que 
tienen ciclos o patrones complejos de vibración que se repiten de forma periódica, y 
aperiódicas, en las que no se pueden apreciar ciclos repetitivos. Perceptivamente son muy 
distintas: en las primeras oímos un sonido dotado de un tono o tonalidad; es el caso de las 
notas musicales, de un silbido, de una sirena o de las vocales y consonantes sonoras; las 
segundas se perciben como ruidos, sin tono, como ocurre con los sonidos causados por un 
soplo, un golpe, una fricción, una explosión o las consonantes sordas. 

En el lenguaje están presentes también los dos tipos de ondas: periódicas, que corresponden 
a los sonidos sonoros producidos por la vibración de las cuerdas vocales (vocales, y 
consonantes sonoras como /b/, /d/, /g/, /m/, /n/, /t/, /V/, etc.), y aperiódicas, que corresponden 
a los ruidos o sonidos sordos producidos por el paso del aire a través de un sitio estrecho, o 
una pequeña explosión generada por la brusca liberación de una obstrucción (/s/, /f/, /8/, /p/, 

1t/, /K/, etc.). 

>>> En la figura 5-2 A se muestra 
A pOr la onda acústica 
correspondiente a la frase 
«Los médicos salen a la 


calle» dicha por una mujer. 
Como toda onda lingúística, 
es de carácter continuo, sólo 


B Onda aperiódica:/s ' aparentemente interrumpida 
c Onda periódica: /e/ 
por las consonantes 
Figura 5-2. A) Onda acústica de la frase «Los médicos salen a la calle». B) Fragmento ampliado de la onda ñ A 
aperiódica correspondiente a la consonante /s/ de «médicos»; en ella no se aprecian ciclos periódicos y se percibe oclusivas: /k/ de «médicos» y 
como un ruido, C) Fragmento de onda periódica de la vocal /e/ de «salen»; en ella se aprecian claramente los ciclos LE . 
periódicos. «Calle». También se aprecia 


la naturaleza esencialmente rítmica del lenguaje humano, formado por una sucesión de 
elementos silábicos que alternan momentos de menor (consonantes) y mayor energía 
(núcleos vocálicos). A su vez, la onda acústica tiene segmentos periódicos en los que 
funcionan las cuerdas vocales y segmentos aperiódicos en los que éstas no participan. Se ha 
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seleccionado un ejemplo ampliado de cada clase. En la figura 5-2 C se observa la onda 
periódica de la vocal /e/ de «salen», en la que claramente se aprecia una sucesión de ciclos 
semejantes; su naturaleza periódica es debida a la vibración de las cuerdas vocales, como 
sucede en todas las vocales y consonantes sonoras. En la figura 5-2 B puede verse la onda 
ampliada de la /s/ de «médicos», claramente aperiódica, sin que puedan identificarse ciclos 
en ella. Se produce al pasar el aire a presión por un paso estrecho -formado entre la lengua y 
los alvéolos superiores- y friccionar con los tejidos de las paredes. El aire forma infinidad de 
turbulencias o microrremolinos, cada uno con una frecuencia propia, sumando un conjunto 
desordenado de frecuencias que se rigen por las leyes del caos. 

Espectrogramas. Una onda acústica contiene mucha información que no es posible observar 
directamente mediante la mera inspección de su forma. Sabemos que una onda compleja se 
compone de muchas otras simples, cada una con una frecuencia y una intensidad 
particulares, por lo que el sonido posee distintos grados de energía en unas frecuencias u 
otras. ¿No hay alguna forma de visualizar la distribución de esta energía a través de las 
frecuencias? Esto se consigue gracias a los espectrogramas obtenidos mediante un 
espectrógrafo. 

En la década de 1940, los Bell Telephone Laboratories construyeron el primer espectrógrafo 
de sonido, una máquina capaz de analizar los sonidos en sus diferentes componentes 
frecuenciales. Sus desarrolladores deseaban obtener una representación visual del sonido 
para poder estudiarlo en toda su complejidad. La investigación se aceleró durante la Segunda 
Guerra Mundial con la idea de que las voces por radio del enemigo pudieran ser analizadas y 
descifradas mejor mediante espectrogramas generados por el espectrógrafo; pero la guerra 
acabó antes de que la técnica estuviera a punto. 

El principio básico de un espectrógrafo es el mismo que el de un prisma que descompone la 
luz en sus colores integrantes (Fig. 5-3 A). En esencia, consistía en una colección de filtros 
ajustados a diferentes frecuencias específicas que se activaban cuando pasaba a su través 
energía de esa frecuencia, o próxima a ella. El aparato constaba de un tambor o rodillo rota- 
torio sobre el que se colocaba un papel especial encerado que se oscurecía por efecto del 
calor. Una vez efectuada la grabación del sonido que se deseaba analizar, éste se hacía pasar 
a través de la colección de filtros mientras giraba el tambor. De esta forma, la energía 
correspondiente a cada banda de frecuencia pasaba a través del filtro respectivo, que 
terminaba en una aguja apoyada sobre el papel. Cuanto mayor era la energía, más cantidad 
de corriente eléctrica circulaba por la aguja calentando el papel encerado y oscureciéndolo en 
mayor medida. Así se obtuvieron los primeros espectrogramas, en los que aparecían 
representadas las tres dimensiones básicas del sonido: el tiempo, en el eje horizontal, las 
diferentes frecuencias en el eje vertical, y la amplitud en la mayor o menor intensidad del 
dibujo. 
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Tiempo 


Figura 5-3. Dos ejemplos de espectrogramas. A) Espectrograma creado por un espectrógrafo. El principio básico 

es el mismo que el de un prisma que descompone la luz en sus colores integrantes. El sonido pasa a través de un 

banco de filtros, cada uno especializado en un frecuencia determinada. Cuando los filtros se activan, queman el 

papel encerado y lo tiznan de negro mientras va girando sobre un rodillo en la dirección que indica la flecha. Las 

partes oscuras corresponden a las zonas de mayor energía. B) Onda (arriba) y espectrograma (abajo) de la frase 

«¿Quieres más café?» pronunciada por una mujer. Obsérvense los formantes (F1, F2, F3, F4, F5), las estrías corres- 

pondientes a los movimientos de apertura y cierre de las cuerdas vocales y la oclusión de la consonante c (/k/) de 

«café». En las consonantes sordas (/s/, /f/) no se aprecian estrías. 
El espectrógrafo de sonido se reveló especialmente útil para el análisis del habla humana, y 
la espectrografía acústica ha sido la técnica reina en su estudio. Hoy los espectrogramas se 
obtienen en los ordenadores a través de software especializado, alguno libre en Internet como 
el célebre Praat (http://www. fon.hum.uva.nl/praat/). 
Para entender mejor los principales rasgos de un espectrograma, observemos la figura 5-3 B. 
En su parte superior tenemos la onda acústica de la frase «¿Quieres más café?» pronunciada 
por una mujer. Debajo está su espectrograma alineado temporalmente con la onda, lo que 
permite observar las correspondencias entre las partes de la onda y las del espectrograma. La 
onda es una variación de energía que se extiende a lo largo del eje del tiempo, y el 
espectrograma presenta sus tres dimensiones básicas: el eje del tiempo, horizontal; el eje de 
frecuencias, vertical, y la intensidad, representada por los distintos grados de grises. Aquí el 
eje de frecuencias se extiende desde O a 12.000 Hz. Ambos, onda y espectrograma, son 
continuos, únicamente interrumpidos por la momentánea oclusión de aire durante la 
pronunciación de la consonante oclusiva /k/ (c, de «café»). Vemos que las partes periódicas 


de la onda, que son fonemas sonoros —Vvocales y consonantes sonoras- en los que 
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intervienen las cuerdas vocales, corresponden a zonas del espectrograma donde se pueden 
apreciar a modo de estrías verticales, o líneas muy finas separadas por espacios en blanco. 
Las estrías son el resultado de la rápida sucesión de movimientos de apertura y cierre de la 
cuerdas vocales; cada línea oscura representa el instante en que las cuerdas vocales están 
abiertas, liberando energía, mientras que el espacio blanco entre dos estrías corresponde al 
instante en que están cerradas, sin salida de aire ni energía. En los fonemas sordos como la 
/s/ o la /f/, las cuerdas vocales no están activas y, por lo tanto, no se ven estrías. 

Para percibir el habla son particularmente importantes los formantes; consisten en las franjas 
oscuras horizontales de gran concentración de energía que se observan en la mitad inferior 
del espectrograma. Están numerados desde abajo como F1 (primer formante), F2, F3, F4 y 
F5. Los formantes corresponden a las resonancias de la garganta, o frecuencias que resultan 
potenciadas debido a la forma del conducto o tracto vocal. Esto sucede según los principios 
físicos de la acústica de tubos. Dependiendo de las formas que el «tubo» vocal adopta 
durante la articulación de las palabras, los formantes aparecen en diferentes posiciones o 
frecuencias, y este hecho es clave para identificar los fonemas y entender el lenguaje. 

Para hacernos una idea de la importancia que tienen los formantes en la percepción del 
lenguaje, hay que señalar que podemos entender frases completas basándonos únicamente en 
dos o tres ondas puras, si éstas siguen la trayectorias de los formantes, como demostraron 
Robert Remez y sus colaboradores en los años ochenta (Remez, Rubin, Pisoni y Carrell, 
1981). En la figura 5-4 A se muestra el espectrograma de la frase «El avión vuela sobre las 
nubes altas», y en la figura 5-4 B, el de un estímulo acústico formado por dos ondas simples 
que siguen las trayectorias del primero y del segundo formantes (F1 y E2). 


B qn YAA AMIA 


Figura 5-4. Importancia de los formantes en la percepción del lenguaje. A) Espectrograma de la frase «El avión 
vuela sobre las nubes altas» dicha por un varón. B) Réplica acústica formada únicamente por dos ondas puras que 
siguen las trayectorias del primero (F1) y del segundo (F2) formante de la frase. Escuchando este estímulo artificial 
se puede percibir la frase completa. Ejemplo tomado de González y Cervera (2000). 


Con un mínimo entrenamiento, cualquier persona puede entender la frase completa 
escuchando el estímulo artificial. 

Síntesis del habla. Mediante el espectrógrafo se pasa de la onda al espectrograma; se analiza 
el sonido en sus partes. ¿No sería posible el camino inverso? Es decir, a partir de un 
espectrograma reconstruir artificialmente la onda completa para ser escuchada. En este caso 
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estaríamos hablando de síntesis, o pasar de las partes al todo; justamente lo contrario del 
análisis, que es pasar del todo a las partes. Por ese motivo, el proceso de crear una señal de 
habla artificial recibe el nombre de síntesis de habla. 

Uno de los primeros intentos de crear habla artificial fue el Pattern Playback, o reproductor 
de patrones de los Laboratorios Haskins (Recuardro 5-2). 


Recuadro 5-2. Reproductor de patrones 


Una década más tarde de la invención del 
espectrógrafo se construyó el Pattern Playback, 
o reproductor de patrones de los laboratorios These days a chicken leg is a rare dish 
Haskins de Nueva York (hoy en New Haven). ; oy 
Se trataba de un aparato de exploración ópti- 
ca que transformaba el dibujo de un espectro- 
grama en sonido (se pueden observar algunos 
ejemplos originales en la página web del labo- 
ratorio  http://www.haskins.yale.edu/featured/ 
sentences/ppsentences.html). El interés inicial Figura 5-5. Ejemplo original de espectrograma 
era inventar un aparato capaz de leer textos en esquemático pintado sobre papel de acetato 
voz alta a las personas ciegas. Antes se habían (con la frase en inglés: «En estos días una pata 
puesto a prueba varios códigos o alfabetos so- Ye Pollo es un plato raro») usado por los labora- 
noros, pero no se halló ninguno que pudiera ser torios Haskins para producir habla artificial en el 
entendido a una velocidad mayor que el alfabeto E pones Es mania pa 

2 . responden a las zonas de energía de los forman- 
Morse (y éste se comprende a un ritmo 10 ye tes, y las nubes de puntos representan la ener- 
ces más lento que el habla normal). El funciona- gía en las consonantes fricativas. 
miento del reproductor de patrones era, en reali- 
dad, semejante al de una pianola. Sobre una hoja 
transparente de acetato de gran tamaño (Fig. 5-5) se pintaba a mano un espectrograma de 
forma estilizada, eludiendo detalles irrelevantes; luego la hoja se hacía pasar por delante de 
un conjunto de células fotoeléctricas conectadas a generadores de sonidos, cada uno afinado a 
una frecuencia determinada. Las células fotoeléctricas son dispositivos sensibles a la luz que se 
activan ante la interrupción de la luz que incide sobre ellas (como en los ascensores). Al pasar el 
dibujo, sonaban simultáneamente las frecuencias acústicas correspondientes a las zonas oscuras 
del espectrograma y el resultado era un habla robótica y poco natural pero inteligible. 


El objetivo primero de construir una máquina lectora para las personas ciegas fracasó por 
culpa de la variabilidad natural de los fonemas según su contexto fonético. La idea era disponer 
de una especie de «alfabeto sonoro», un conjunto de plantillas fijas, una por fonema, que al com- 
binarse dieran lugar a cualquier palabra para ser escuchada. Al hacerlo, sin embargo, el resultado 
era una sucesión de sonidos ininteligibles. ¿A qué se debía esto? En los laboratorios Haskins 
pronto comprendieron que cada fonema presenta espectrogramas muy distintos dependiendo de 
los fonemas que van delante y los que van detrás. Por lo tanto, no sirve una única plantilla por 
fonema. Este hallazgo puso por primera vez de manifiesto la gran complejidad de los procesos 
perceptivos del habla y supuso un acicate para emprender una fructífera línea de investigación. 
A lo largo de décadas, los laboratorios Haskins fueron pioneros en el estudio de la percepción 
del habla y, a través de muchos experimentos con los dibujos estilizados de espectrogramas, se 
fueron identificando de modo sistemático los rasgos acústicos que son esenciales para percibir 
el lenguaje. Más tarde, y gracias a los ordenadores, la investigación perceptiva ha continuado 
mediante el uso de estímulos artificiales logrados por medios electrónicos. 


Con el desarrollo de la electrónica han surgido sistemas de síntesis de voz mucho más 
perfectos que el reproductor de patrones de los laboratorios Haskins. En los años ochenta 
hizo su aparición un sintetizador desarrollado por Dennis Klatt en el Instituto Tecnológico de 
Massachusetts que generaba una voz artificial muy parecida a la natural, basándose en un 
modelo matemático del tracto vocal humano. Constituye el núcleo de uno de los conversores 
texto-voz más conocidos, el DECtalk, un sistema de habla artificial particularmente útil para 
las personas imposibilitadas de hablar, como es el caso del físico y matemático de 
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Cambridge, Stephen Hawking, afectado de esclerosis lateral amiotrófica. Gracias a este 
sistema, Hawking puede pronunciar brillantes conferencias ante un público entregado. 


RASGOS GENERALES DE LA PERCEPCIÓN DEL HABLA 

La naturaleza ha conseguido que el habla humana sea un medio de comunicación excelente: 
rápido y muy eficaz. Nuestros procesos perceptivos deben ser rápidos y robustos porque el 
lenguaje hablado, al contrario que el escrito, es de naturaleza efímera y evanescente. A 
continuación se revisarán algunas de sus características generales. 

Rapidez. Comparado con cualquier otro código acústico de comunicación, el habla es 
mucho más rápida que el más veloz de los códigos. Por ejemplo, un experto en código Morse 
alcanza velocidades de desciframiento a lo sumo 10 veces más lentas que cuando escucha 
una conversación. Nuestra capacidad de resolución temporal acústica es muy limitada. La 
velocidad más rápida a la que es posible identificar por separado unidades discretas de 
cualquier clase de sonido se sitúa en torno a las 7-9 unidades por segundo. Más allá de esa 
velocidad los sonidos se «funden» y se empieza a oír algo así como un «zumbido» 
indiferenciado que, según aumenta el ritmo, se convierte en un tono. Sin embargo, cuando 
oímos habla, la velocidad a la que se transmiten los sonidos durante la comunicación 
cotidiana se encuentra entre 20-30 segmentos por segundo, sin que exista problema alguno 
para identificarlos (Lieberman y Blumstein, 1988) (Fig. 5-6). Pensemos, por ejemplo, en la 
retransmisión de un partido de fútbol. Figura 5-6. 

Diferencias en la capacidad de resolución temporal 


9000 q..00. entre el habla y los restantes sonidos en el ser humano. 
A El límite para identificar sonidos individuales está en 7- 
«....cogelapelota, burlaaldefensaychutaagol...» 9 unidades por segundo. Sin embargo, es posible 
Sonidos del habla: 20-30 unidades/sez—| identificar sin problemas los sonidos del habla a razón 


Figura 5-6. Diferencias en la capacidad de resolución de 20-30 unidades por segundo y aun mas. 
temporal entre el habla y los restantes sonidos en el ser Robustez. La ercepción del lenguaje oral es un 
humano. El límite para identificar sonidos individuales : p Pp gua) 


tea po e Pe proceso muy eficaz. Nuestra capacidad de identificar 

razón de 20-30 unidades por segundo y aun más. los sonidos del habla es asombrosamente robusta. 
Podemos mantener conversaciones en las condiciones de ruido más adversas; es posible 
someter la onda a increíbles alteraciones y mutilaciones y aun así continuar entendiendo el 
mensaje. Como declaraba Miller (1984), «el oído humano es el mayor capital no declarado 
de la industria de la telecomunicación; puede extraer un mensaje de cualquier tipo de señal, 
por degradada que esté» (p. 89). En sus propias palabras: 
Desde los primeros experimentos quedó claro que el habla es sumamente resistente a la de- 
formación. Mientras sea audible, los cambios de intensidad no tienen ningún efecto sobre su 
inteligibilidad hasta que se vuelve tan intensa que provoca dolor. La conversación es posible 
con tal de que haya tanta energía en la señal hablada como en el ruido enmascarador. No se 
encuentran dificultades serias hasta que la energía del ruido es unas cuatro veces mayor que 
la del habla. [...] Si cambiamos la configuración de la onda vocal mediante el acortamiento 
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de los «picos», el habla es aún inteligible. [...] Otras alteraciones destruyen cualquier 
vestigio de naturalidad; pero la naturalidad no es importante para la inteligibilidad. [...] Si 
aumentamos al doble o disminuimos a la mitad la velocidad de emisión, la precisión con que 
se perciben las palabras tampoco se ve afectada. La resistencia del habla al ruido y a la 
distorsión es verdaderamente extraordinaria (Miller, 1984, p. 91). 
Sirva de ejemplo la resistencia al «recorte» de los picos 
del habla. Si en la onda acústica del lenguaje se elimina 
la energía correspondiente a sus picos, la inteligibilidad 
apenas se resiente. En la figura 5-7 se muestran dos 
ejemplos de recorte de picos. 
Complejidad. La percepción del habla es un proceso 
muy complejo y, a la vez, automático. Apenas 
> et da IA vislumbramos su extraordinaria complejidad cuando 
intentamos que las máquinas desempeñen de forma 
artificial dicho proceso. En la década de 1960 se 
pensaba que hoy, una vez iniciado el siglo XXL, 
Figura 5-7. Resistencia del habla a la degradación de dispondríamos de robots y ordenadores que entenderían 
la señal. A] Onda intacta. B y C) La misma onda con 
«recorte» de picos en distintos grados. Incluso en la Nuestro lenguaje y se comunicarían fluidamente con 
forma más degradada (C), se conserva la inteligibilidad , a , A 
de más del 90 % de las palabras. nosotros. Cuando en las décadas siguientes ingenieros y 
programadores se pusieron manos a la obra, pronto 
comprendieron la dificultad de simular artificialmente los procesos de percepción del 
lenguaje. Aunque se ha avanzado mucho en los últimos años, la computadora más potente 
con el software más complejo todavía no es capaz de emular con fiabilidad el 
reconocimiento del habla. Gracias a la actual potencia de cálculo y la aplicación de 
complejos algoritmos matemáticos (principalmente modelos ocultos de Markov combinados 
con redes neuronales artificiales), conseguimos que un ordenador, dentro de ciertos límites, 
pueda reconocer lenguaje y pasarlo a un texto. Pero esto ocurre con importantes limitaciones: 
los sistemas que funcionan con hablantes múltiples sólo pueden manejar un número limitado 
de palabras; los sistemas que reconocen muchas palabras sólo pueden funcionar con un único 
hablante, a cuya voz particular han tenido que ser entrenados previamente. Con frecuencia 
una palabra es confundida con otra semejante; una tos, una puerta al cerrarse, un golpe en la 
mesa, etc., se identifican erróneamente como una consonante. Y todo esto en condiciones 
ideales de audición, sin apenas ruido de fondo u otros sonidos competidores. Aún cuesta 
imaginar que un ordenador realice lo que nosotros hacemos todos los días sin problemas: 
seguir una conversación en un contexto de conversaciones paralelas, es decir, discernir el 
habla de un hablante particular y evitar la «invasión» del sonido de otras personas que hablan 
al mismo tiempo en la proximidad. Se trata del denominado efecto «coctail-party». Por el 
contrario, nuestro sistema natural de percepción es altamente flexible y adaptable a la 
extraordinaria variabilidad de la señal del habla humana. 
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Automática. A pesar de su complejidad, la mayor parte de los subprocesos implicados en la 
percepción del habla son de naturaleza automática, y los llevamos a cabo sin apenas esfuerzo 
y sin conciencia de ellos. En palabras de Ryalls (1996), es como si la madre naturaleza 
hubiera ocultado su complejidad para permitir concentramos al ciento por ciento en la meta 
principal: la construcción del significado. Si tuviéramos que emplear conscientemente 
nuestra atención en las operaciones necesarias para percibir los sonidos lingúísticos, no nos 
quedarían recursos cognitivos disponibles -ni tiempo- para procesar los significados. 
Diferente. En algunos aspectos, la percepción del habla difiere de la de los sonidos en 
general. Ya se ha mencionado que una diferencia importante es que los sonidos del habla 
(fonemas) pueden identificarse a razón de 20-30 unidades por segundo, frente a las 7-9 
unidades de cualquier otra clase de sonidos. Hay otra diferencia importante que señalar: el 
comportamiento anómalo del habla en lo que se refiere a las tareas de discriminación e iden- 
tificación (Lieberman y Blumstein, 1988). En cualquier ámbito de la percepción, no sólo en 
la modalidad auditiva sino también en la visual, nuestra maquinaria cognitiva está construida 
de tal modo que nos resulta mucho más fácil discriminar entre estímulos que identificarlos. 
En el habla sucede al revés. 

La discriminación exige comparar dos estímulos presentados al sistema perceptivo y 
determinar si son iguales o distintos. La identificación implica la comparación entre un único 
estímulo y una representación mental que tenemos almacenada en nuestra memoria. Por 
ejemplo, somos muy sensibles a pequeñas variaciones de color -de longitud de onda- entre 
dos estímulos visuales. Percibimos el más ligero cambio en el matiz entre dos colores 
parecidos. Sin embargo, si vamos a la droguería a comprar exactamente el color de pintura 
que tenemos en nuestro salón y hemos olvidado llevar una muestra, estamos condenados a 
equivocarnos. En ese momento no estamos discriminando, sino identificando un color, es 
decir, comparando el estímulo que nos ofrece el droguero con una representación mental del 
color de nuestra casa. Podemos hacer miles de discriminaciones entre tonos cromáticos, pero 
sólo identificamos con fiabilidad unos pocos colores -¿no nos recuerda esto a un mágico 
número siete, más menos dos? (Miller, 1956). 

En el dominio auditivo sucede algo semejante; está demostrado que cualquier persona puede 
discriminar entre unos 350.000 tonos puros distintos (Stevens y Davis, 1938), pero sólo 
identifica unos pocos de ellos. Imaginemos que alguien de espaldas a nosotros toca una nota 
en un piano, y debemos decir algo así como «fa de la tercera octava». Incluso un músico 
experimentado y con muchos años de solfeo sólo identificará unas pocas notas aisladas, si no 
cuenta con el apoyo de una escala musical (de nuevo nos vuelve a rondar el número «má- 
gico»). Sólo unos pocos individuos, excepcionalmente dotados de lo que se denomina oído 
absoluto, pueden superar ese límite. 

Sin embargo, la percepción del habla sigue una pauta distinta: somos peores en 
discriminación que en identificación. Hay sonidos fonéticos, particularmente las consonantes 
oclusivas, difíciles de discriminar entre sí cuando pertenecen a la misma categoría: por 
ejemplo, es difícil distinguir entre variaciones distintas de la /p/ o entre variaciones de /b/ o 
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de /k/; nos suenan todas del mismo modo. Los japoneses no diferencian entre /l/ y /r/ porque 
en su idioma pertenecen a la misma categoría fonológica (o sea, ambos sonidos forman una 
única consonante en japonés y no existen palabras que se diferencien sólo por ese matiz, 
como «palo» y «paro», en castellano). Todas esas variaciones son físicamente distintas, 
como revelan los espectrogramas; las mismas variaciones entre tonos puros las percibiríamos 
inmediatamente, pero en un contexto de habla somos «sordos» a ellas. Por el contrario, 
somos muy eficientes identificando los sonidos del habla; si no, ¿qué otra cosa hacemos 
cuando percibimos el lenguaje a razón de 20-30 fonemas por segundo? En ese momento 
comparamos los estímulos de entrada con representaciones mentales almacenadas en nuestra 
memoria. En cierto modo, es como «ir a la droguería» 20 o 30 veces por segundo. 
En resumen, la percepción del habla es: 
e 10 veces más veloz que cualquier otro código acústico (p. ej., Morse). 
e Robusta: muy resistente al ruido y a la degradación de la señal. 
e Compleja: flexible y adaptativa a la extrema variabilidad de la señal acústica. 
e Automática: sin apenas esfuerzo ni participación de la conciencia. 
e Diferente a la de otros sonidos: mayor resolución temporal, distinta relación entre 
discriminación e identificación, y otras propiedades que luego se analizarán. 
Ausencia de invarianza. La percepción del habla o lenguaje oral puede definirse como un 
proceso complejo por el cual una señal acústica continua y altamente variable activa 
representaciones mentales discretas y estables de los fonemas de una lengua (Fig. 5-8). 
La comprensión de este proceso remite a un problema 
lal que aún no hemos sabido resolver: la ausencia de 
um invarianza. 
Ya hemos señalado que la percepción del habla es un 
proceso robusto y, al mismo tiempo, muy flexible y 
paja ob hb EA adaptativo, porque el estímulo de entrada es 
enormemente variable. Además, la variabilidad del 
habla intrasujeto es prácticamente tan amplia como la 
variabilidad intersujeto (de ahí la dificultad de las 
pruebas forenses para identificación de hablantes). 
Nuestra voz y nuestra forma de pronunciar pueden cambiar asombrosamente de unas 
situaciones a otras, tanto involuntaria como deliberadamente. A esto se añade el hecho de 
que la señal es muy dependiente del contexto fonético: el mismo fonema puede tener ondas 
muy distintas por la influencia de los fonemas precedentes y posteriores, como demuestran 
los análisis acústicos, aunque no seamos perceptivamente conscientes de ello. 
En definitiva, podemos oír, por ejemplo, cientos de /a/ distintas (Fig. 5-9), con voces agudas, 
graves, masculinas, femeninas, infantiles, nasales, impostadas, disártricas, susurradas, con 
voz. disimulada, con ruido de fondo, a velocidades distintas, etc., y somos capaces de, por 
encima de todas esas variaciones, oír algo común a todas ellas que hace que nos suene como 
la vocal /a/, y diferenciarla de otros cientos de ondas que nos suenan a /e/, /u/, /p/ o /m/. 


Figura 5-8. En la percepción del habla, una señal 
acústica continua y altamente variable activa repre- 
sentaciones mentales estables y discretas de los fone- 
mas de una lengua. 
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Las ondas que suenan /a/ han de tener algo en común 
que no tienen las ondas que suenan /e/. Ese algo común 


A es lo que nuestro sistema perceptivo sabe «capturar» 


| evo sin caer en error por las enormes variaciones de unas 


GA e pd ondas a otras, y ese algo común es lo que cuesta tanto 
ROA AA NA hacer entender a los ordenadores en los programas de 


A AAN reconocimiento de habla. Ese algo común es lo que se 

Todas estas ondas acústicas, y otros cientos más, se ha bautizado con el nombre de invarianza fonética (o si 

A se prefiere, invariancia o constancia). 
Ahora bien, ¿dónde está físicamente la invarianza en las ondas de la /a/? Tal vez está 
«camuflada» dentro de la información de la onda y sólo podemos acceder a ella a través de 
algún tipo de análisis más sofisticado que la mera inspección de la onda. En cierto modo esto 
es así cuando hablamos de vocales: los análisis espectrográficos -espectrogramas- revelan 
que la invarianza acústica podría estar en los formantes, como se verá más adelante. 
El problema, al que aludíamos antes, es que hay sonidos del habla -sobre todo las conso- 
nantes oclusivas— en los que, por mucho que se busque y rebusque con toda clase de 
análisis, la invarianza no acaba de aparecer en la señal acústica. Es el tantas veces citado 
problema de la ausencia de invarianza del estímulo del habla. Pero «haberla, hayla»; en 
alguna parte tiene que estar, porque nuestro sistema perceptivo sí la encuentra; de lo 
contrario, no podríamos identificar el mismo fonema en esa multitud de ondas. Volveremos a 
este tema más adelante al abordar la percepción de las consonantes. 
Hemos señalado que la percepción del habla presenta unas características llamativas que la 
separan de la percepción de otros sonidos. Además de las mencionadas sobre la rapidez y 
eficiencia en la identificación de los sonidos lingiísticos y la ausencia de invarianza, hay que 
añadir otra propiedad como la percepción categórica que veremos más adelante. Todo ello ha 
llevado a que los científicos se pregunten si existe un mecanismo especial para percibir el 
habla (Recuadro 5-3). 


Recuadro 5-3. ¿Un mecanismo especializado para percibir el habla? 


Desde los comienzos de la investigación experimental en la década de 1950, y aun antes, 
una pregunta básica ha planeado sobre la comunidad científica y continúa sin tener una 
respuesta definitiva: ¿existe en nuestro cerebro un mecanismo perceptivo especializado en 
procesar los sonidos del lenguaje, diferenciado del mecanismo general de la audición? 

El hecho de que esta pregunta no tenga hoy una respuesta definitiva significa que la 
evidencia empírica, obtenida en medio siglo de experimentación, se ha ido repartiendo a 
favor y en contra de dicho mecanismo especial (Diehl, Lotto y Holt, 2004; Samuel, 2011). 
Así, los autores y grupos de investigación se han ido posicionando en torno a dos polos con 
algunas variantes intermedias: 

* Quienes defienden que, probablemente por evolución, el ser humano ha desarrollado en su 
cerebro un mecanismo especial, distinto de la percepción general de los sonidos, que se en- 
carga de procesar una clase muy particular de sonidos: el habla humana. En su formulación 
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más radical, esta hipótesis considera que el mecanismo actuaría como un verdadero módulo 
de funcionamiento rápido, automático, encapsulado y blindado a la influencia externa de 
otras partes del sistema perceptivo. Se activaría inevitablemente en cuanto estuviera expues- 
to a sonidos del lenguaje y se impondría por encima del mecanismo general de la percepción 
auditiva. Este módulo formaría parte de un sistema más amplio, correspondiente al lenguaje 
en su conjunto. 

+ Quienes consideran que lo especial es el estímulo (habla), no el mecanismo perceptivo. El 
lenguaje se percibe con el mismo mecanismo general con que percibimos cualquier sonido. 
Si se observan algunas características especiales, que son innegables, es porque el habla 
humana es un tipo de estimulación sobreaprendida, a la que estamos expuestos de forma 
continua y permanente desde que nacemos hasta la muerte. Nuestro sistema perceptivo 
general tiene un nivel de entrenamiento extraordinario en esta clase de sonidos. 


e Percepción de las vocales 
El lenguaje humano puede definirse como una sucesión de movimientos de apertura y cierre 
de la boca. Las aperturas corresponderían a las vocales, y los cierres, a las consonantes. En 
las consonantes se produce un estrechamiento o restricción en la cavidad bucal muy 
importante, a veces completa, como en las oclusivas. En las vocales, el sonido se produce sin 
dificultad, con una restricción mucho más suave. Las vocales forman el núcleo de las sílabas, 
y pueden existir sílabas formadas sólo por una vocal, lo cual no sucede con las consonantes. 
Todas las lenguas del mundo tienen ambas clases de sonidos, generalmente menos vocales 
que consonantes. En la base de 317 lenguas de Maddieson (1984), el número de vocales que 
contienen va desde 3 (p. ej., tagalo) hasta 24 (p. ej., lak), siendo 5 el número de vocales más 
común (en idiomas tan dispares como español, japonés o suahili). Las vocales más extremas, 
que ocupan los vértices del triángulo vocálico, son las más comunes: /i/, /a/, /vw, 
probablemente porque son las más distinguibles entre sí desde el punto de vista perceptivo. 
En la figura 5-10 se observa el triángulo articulatorio de las vocales castellanas, según la 
posición que adopta la lengua al pronunciar cada vocal (Quilis, 1993). 
De acuerdo con el eje horizontal, las vocales pueden 
Anterior___ Central Posterior ser anteriores (lengua en posición delantera), como la 


/i/ y, en menor medida, la /e/; centrales, como la /a/, y 
posteriores (lengua en posición trasera), como la /o/ y 


Alta 


sobre todo la /u/. Según el eje vertical, la lengua puede 
estar en una posición alta, media o baja. Esta posición 
determina también el grado de apertura de la boca, 


Media 


siendo /a/ la vocal más abierta, /e/ y /o/ semiabiertas, y 
las vocales /i/ y /u/, cerradas. 


: Ed Papel de los formantes 
Figura 5-10. Triángulo articulatorio de la vocales 


castellanas, según la posición de la lengua. Adaptado Las distintas posiciones de la lengua y otros órganos 
de Quilis (1993). 


a 


Baja 


A AA A 


móviles (labios, mandíbula, velo del paladar) hacen 
que cambie la forma general del conducto vocal, variando sus resonancias acústicas O 


booksmedicos.org 


13 


Psicología del Lenguaje — TEMA 5 


formantes. Como se ha señalado antes, los formantes son las resonancias naturales del tracto 
vocal que se rigen por la acústica de tubos. Corresponden a las frecuencias que son 
reforzadas como consecuencia de la forma que adopta el tubo vocal en cada momento. En los 
espectrogramas aparecen como franjas oscuras horizontales de mayor energía. 

Es precisamente en los formantes donde reside la clave de la percepción de las vocales. Las 
fuentes de evidencia proceden de: 

* La síntesis de vocales artificiales demuestra que cuando se alteran los formantes, el sonido 
resultante suena a una vocal distinta. 

* El análisis de las vocales naturales mediante espectrogramas permite visualizar y medir los 
formantes. Los espectrogramas muestran que a vocales distintas les corresponden formantes 
diferentes, es decir, ci en distintos niveles de frecuencia. 

A A En la figura 5-11 se muestra el espectrograma de la 
palabra «dios» pronunciada por una mujer. Obsérvese 
el «movimiento» de los formantes en el diptongo al 
pasar de la vocal /i/ a la vocal /o/. 

De todos los formantes, los dos primeros (contando 
Figura 5-11. Espectrograma de la palabra «dios» desde abajo) son los más importantes. La investigación 
ns eii rimel con estímulos artificiales demuestra que la mayor parte 
A de las vocales pueden ser identificadas sólo con los dos 
primeros formantes, F1 y F2. De manera que F1 y F2 son esenciales para la inteligibilidad de 
las vocales. Los siguientes formantes, F3, F4 y F5, cuando se incorporan al estímulo artificial 
añaden naturalidad, haciendo que el resultado final se parezca más a la voz humana. La 
importancia de los dos primeros formantes resultó ya evidente en los trabajos pioneros de los 
laboratorios Haskins durante los años cincuenta del pasado siglo. 

De esta forma, cada vocal tiene un patrón característico de F1 y F2. Si se examinan los 
espectrogramas de las cinco vocales castellanas, ordenadas desde la más anterior, /i/, -la 
estrechez causada por la lengua ocurre en la parte delantera de la boca-, a la más posterior, 
/u/ (Fig. 5-12) 


h MATI 
AN IN Al IAN ñi AN A Ñ $ 


MN ATAN 


Ab lo AN 00 
ne AI li MM 


Figura 5-12. Epectrogramas de las cinco vocales castellanas ordenadas desde la más anterior, /i/, a la más pos- 
terior, /u/. Los dos primeros formantes, F1 y F2, están marcados con líneas claras. Según Quilis y Esgueva (1983), 
unos valores típicos para un varón adulto podrían ser: /i/ (F1 = 260 Hz, F2 = 2.300 Hz); /e/ (450, 1.900); /a/ (650, 
1.200); /o/ (470, 900); /u/ (280, 650). Pruebe el lector a sintetizarlas artificialmente en: www.asel.udel.edu/speech/ 
tutorials/[synthesis/vowels.html. 
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se constatan dos principios: 

+ F2es más alto cuanto más anterior es la vocal. Esto se debe a que el espacio que queda 
delante del estrechamiento causado por la lengua es más corto cuanto más anterior se 
sitúa la lengua. Dicho espacio es el principal responsable de la segunda resonancia, O 
F2: cuanto más corto, más alta será la resonancia. 

+ Fl es más alto cuanto más abierta es una vocal. La primera resonancia, o F1, depende 
principalmente de la abertura del tubo vocal. La vocal más abierta, /a/, tiene el F1 más 
alto de todos. A medida que las vocales son más cerradas, F1 ocupa posiciones más 
bajas. Así, en las vocales semiabiertas (/e/, /o/), F1 está más bajo que en /a/, y en las 
vocales cerradas (/1/, /u/), F1 baja todavía más. 

Por otra parte, el abocinamiento que se produce en la /u/ —redondeamiento y prolongación 
de los labios- tiene el efecto de alargar todo el tubo vocal y, por lo tanto, el de bajar ambos 
formantes. 
Variabilidad de los formantes 
Como ya se ha indicado, cada vocal queda definida por la frecuencia de sus formantes, 
particularmente de F1 y F2. Dado que los formantes dependen del tamaño y la forma del 
tracto vocal, existen importantes diferencias individuales a través de los hablantes de 
distintas edades y sexo. Como ocurre en cualquier resonancia de tubos, las frecuencias de los 
formantes son inversamente proporcionales a la longitud del tubo, en este caso, del conducto 
vocal medido desde las cuerdas vocales hasta los labios. De manera que una misma vocal 
difiere considerablemente en los valores absolutos de sus formantes, dependiendo de si es 
pronunciada por una mujer, un varón o un niño; asimismo, dentro de cada grupo, también 
hay diferencias según los tamaños individuales. En promedio, las mujeres adultas tienen un 
tracto vocal más corto (14,75 cm) que los varones (17,5 cm), y sus formantes son un 20 % 
más altos o agudos. Los niños tienen tractos vocales aun más cortos (8,75 cm) y la frecuencia 
de sus formantes es el doble que en los varones adultos (Pickett, 1999). 
Un estudio clásico, muy citado, sobre las vocales 
1 inglesas es el de Peterson y Barney (1952) llevado a 
cabo sobre producciones de un total de 76 hablantes: 33 
hombres, 28 mujeres y 15 niños. El trabajo fue 
actualizado con valores más recientes por Hillenbrand, 
Getty, Clark y Wheeler (1995). Cuando los valores 
formanticos de Cada vocal se representan en un 
diagrama de dispersión F1 x F2 (F1 en un eje y F2 en 
otro, como se muestra en la Fig. 5-13), aparecen nubes 
00 02 04 a 1 o conglomerados de puntos ampliamente extendidos a 
PA RL dd lo largo de grandes zonas señaladas por óvalos, uno por 
en el plano F1 x F2 de los dos primeros formantes. los Cada Clase de vocal. Cada punto representa una vocal 
ote aci ti a a iidual pronunciada por un hablante concreto. La 
gráfica demuestra dos cosas: 
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+ Alta variabilidad de los formantes: la misma vocal articulada por diferentes hablantes 
da lugar a una gran variedad de valores forman-ticos; es decir, los puntos que 
representan a la misma vocal se extienden por una amplia región del plano F1 x F2. 

+ Solapamientos entre las áreas vocálicas: vocales diferentes, dichas por hablantes 
distintos, coinciden a veces en el plano y tienen los mismos, o muy parecidos, valores 
para F1 y F2, aunque los oyentes no las confunden entre sí. Probablemente esto no 
ocurre para el castellano, que cuenta con un sistema vocálico menos abigarrado: 5 
vocales frente a las 10-12 del inglés 

No obstante, a pesar de la amplia variedad de valores formánticos para una misma vocal o 
del solapamiento de formantes entre algunas vocales distintas, los oyentes no tienen 
dificultad en entender el lenguaje y perciben correctamente cada vocal. Parece que cuentan 
con un mecanismo perceptivo que les permite distinguir entre, por ejemplo, una /e/ dicha por 
un niño y una /i/ dicha por un adulto, aunque ambas tengan los mismos F1 y F2. 
Probablemente se apoyan en otras claves acústicas que difieren entre los hablantes, como la 
frecuencia fundamental y otras, para establecer alguna diferencia de escala. Esto nos lleva al 
concepto de normalización. 

Normalización de las vocales 

Si todos los hablantes fueran del mismo tamaño y tuvieran el mismo tracto vocal, una vez 
que el oído ha llevado a cabo el análisis y la extracción de los formantes, el cerebro podría 
relacionar directamente sus frecuencias con una vocal particular. En otras palabras, el 
cerebro podría consultar una especie de tabla de valores archivada para encontrar qué vocal 
concreta corresponde a unos formantes determinados. 

Sin embargo, como ya se ha mencionado, los hablantes son muy distintos entre sí, no sólo 
por las diferencias de sexo y edad, sino también por las fuertes disparidades individuales en 
tamaños del tracto vocal, formas, masas, elasticidad de los tejidos y otras propiedades que 
tienen consecuencias acústicas. Estas diferencias físicas entre hablantes resultan en 
diferencias considerables en los formantes para una misma vocal. Como un niño tiene las 
cavidades de resonancia mucho más pequeñas, sus formantes de, por ejemplo, la /a/ serán 
mucho más altos que los formantes de un adulto para la /a/. ¿Qué operaciones perceptivo- 
cognitivas debe efectuar un oyente para interpretar ambos sonidos, muy distintos en sus 
frecuencias absolutas, como la misma vocal? De alguna manera, debe llevar a término algún 
proceso de estandarización o normalización que transforme los valores formándoos a una 
escala común que admita la comparación entre sí. 

Una primera explicación fue la teoría de la razón entre formantes, según la cual, la 
identificación de las vocales no depende de los valores absolutos, de los formantes, sino de la 
razón o proporción entre ellos. Por ejemplo, las vocales anteriores y cerradas, como la /i/ o la 
/e/, tienen un F1 muy bajo y un F2 muy alto, por lo que la proporción F2/F1 es grande. En 
contraste, las vocales abiertas, como la /a/, tienen un F1 alto y un F2 bajo, por lo que F2/F1 
es pequeña. Según esto, la razón F2/F1 para la /i/ de un niño sería muy semejante a la razón 
F2/F1 de la /i/ de un adulto. Cuando esta teoría se aplica sobre los datos reales, parece que 
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funciona razonablemente bien para muchos casos, pero no los explica todos. Hay algunas 
vocales que son distintas y, sin embargo, presentan la misma razón F2/F1; por ejemplo, /ae/, 
/U/ y luí arrojan la misma proporción de 2,43 (Pickett, 1999). Por lo tanto, aunque la 
proporción entre F2 y F1 podría tener un papel importante en la percepción de las vocales, 
debe haber información adicional que los oyentes usan para el proceso de normalización. 
Dado que la razón F2/F1 no es suficiente para explicar todos los casos, se han propuesto 
otras hipótesis adicionales sobre la normalización vocálica. Estas se dividen entre: 

+ Los modelos de normalización intrínseca, que consideran que cada vocal porta sufi- 
ciente información acústica en sí misma para permitir la normalización. 

* Los modelos de normalización extrínseca, que defienden que los oyentes necesitan in- 
formación externa a la vocal para establecer «un marco de referencia» sobre las 
características del hablante (edad, sexo, tamaño de su tracto vocal, etc.). 

Para los partidarios de la normalización intrínseca es importante la proporción F2/F1, pero, 
además, la vocal contiene información adicional que permite resolver la ambigúedad cuando 
ésta se produce, en concreto, los formantes superiores -particularmente F3- y la frecuencia 
fundamental de la voz, o Fo. Johnson (1990) entiende que la frecuencia fundamental es una 
pista perceptiva importante para identificar al hablante, su edad, su sexo, etc., y así hacer 
inferencias acerca del tamaño del tracto vocal necesarias para una correcta interpretación de 
los formantes. La evidencia experimental con estímulos artificiales ha mostrado que la 
percepción de las vocales se halla influida por los valores que adopta Fo y también por los de 
F3. 

Para los defensores de la normalización externa, los oyentes interpretan los formantes en 
referencia a un contexto más amplio de habla. Es decir, las vocales individuales se perciben 
en relación con el inventario completo de vocales de un hablante determinado, y este 
inventario se extrae de los fragmentos de habla precedentes. Aquí, el trabajo clásico de 
referencia, también muy citado, se basa en los experimentos de Ladefoged y Broadbent 
(1957). Estos autores examinaron la identificación de un conjunto de vocales inglesas 
sintetizadas artificialmente dentro de un contexto silábico /b-vocal-t/. Las vocales se 
presentaban dentro de una frase que servía de contexto precursor, cuyos valores promedios 
de Fl y F2 se manipularon experimentalmente. Los resultados mostraron que la 
identificación de las vocales estaba influida por los cambios formánticos de la frase. Así, 
cuando se bajó experimentalmente F1 en la frase precursora, la sílaba /bit/ fue percibida más 
a menudo como /bEt/, es decir, como si, en contraste, el F1 vocálico fuera más alto. A la 
inversa, al subir el valor de F1 en la frase, la sílaba /baet/ fue en realidad percibida más veces 
como /bEt/, que tiene un F1 más bajo. Estos cambios en la identificación de la vocal estaban 
en línea con lo establecido por la hipótesis: el oyente evaluaba los formantes de la vocal en 
relación con el rango de valores contenidos en la frase precursora. Dependiendo de ello, se 
oía una vocal u otra, a pesar de que el estímulo físico era el mismo. También Dechovitz 
(1977) encontró resultados semejantes utilizando frases naturales, en lugar de artificiales, y 
Nearey (1989) obtuvo datos en la misma línea utilizando listas de palabras. 
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Percepción continuo de las vocales 
Al contrario que algunas consonantes, como se verá más adelante, las vocales se perciben de 


forma continua. Cualquier variación en las frecuencias de los formantes es percibida por el 
oyente, y cambios continuos y graduales de los valores formánticos se perciben también de 
forma continua. Si sintetizamos un conjunto de vocales artificiales cuyos formantes tengan 
valores que vayan desde los típicos de una vocal a los de otra, todos los estímulos 
intermedios se perciben como vocales intermedias entre ambas. Por ejemplo, supóngase que 
entre una /i/ (Fl = 260 Hz, F2 = 2.300 Hz) y una /e/ (Fl = 440 Hz, F2 = 1.850 Hz) creamos 
con un sintetizador de vocales 8 estímulos intermedios en pasos iguales de Fl y F2 (Fig. 5- 
14): 

(280, 2.250), (300, 2.200), (320, 2.150), (340, 2.100), (360, 2.050), (380, 2.000), 

(400, 1.950), (420, 1.900). 


F2 


| h | 
FI M0 ww y w 


¡ e 


Figura 5-14. Percepción continua de las vocales. Cambios continuos y graduales de las frecuencias de los for- 
mantes se perciben de forma continua. En el ejemplo se han sintetizado 8 estímulos con valores de F1 y F2 
comprendidos entre los típicos de una /i/ y los de una /e/. En ese orden se perciben como una fi/ que se va trans- 
formando progresivamente en una Je/. 


Estos estímulos sonarán como vocales intermedias entre ambas. Si los escuchamos 
secuencialmente oiremos sonidos de vocal /i/ que son cada vez más abiertos y se van 
transformando en una /e/. Esto no ocurre con las consonantes oclusivas, que son percibidas 
de forma categórica y no continua. El lector puede hacer la prueba con el sintetizador de voz 
de tipo Klatt, disponible on line gracias a la Universidad de Delaware en 
www.asel.udel.edu/speech/tuto-rials/synthesis/vowels.html. 
+ Percepción de las consonantes 

Las consonantes son producidas por movimientos o gestos articulatorios rápidos que se 
imponen sobre los más lentos de las vocales. La coordinación de los gestos para las 
consonantes con los gestos vocálicos se organiza en las unidades silábicas, cuyo núcleo es la 
vocal. 

Al contrario que las vocales, las consonantes no pueden formar el núcleo de una sílaba. No 
existen sílabas constituidas sólo por una consonante, como sí puede ocurrir con una vocal. 
De hecho, no es posible pronunciar algunas consonantes de forma aislada, sin la ayuda de 
una vocal: /p/, /t/, /k/, /b/, /d/, /g/. Algunos autores consideran que las sílabas son, en esencia, 
vocales alteradas por delante o detrás por consonantes; es como si las consonantes fueran los 
«márgenes» de las vocales. La percepción de las consonantes es, sin embargo, esencial para 
entender el lenguaje y obedece a procesos más complejos que las vocales. Como se verá 


booksmedicos.org 


18 


Psicología del Lenguaje — TEMA 5 


seguidamente, presenta características particulares que han sido objeto de estudio durante 
décadas, en especial, la percepción categórica. 

Transiciones formánticas 

Existen múltiples pistas perceptivas en la señal del habla para la identificación de los sonidos 
consonanticos, por ejemplo, la composición del ruido en las fricativas como la /s/ o la /f/, los 
formantes propios de algunas consonantes como /m/, /n/, /l/, etc. Por encima de todas las 
pistas, destaca una por ser la más importante: las transiciones de los formantes vocálicos. 
Cuando pronunciamos una vocal de modo aislado (p. ej., /a/), sus formantes presentan una 
apariencia estable, más o menos plana en dirección horizontal. Si la pronunciamos precedida 
o seguida de una consonante (p. ej., /pa/), la trayectoria formántica se ve alterada hacia arriba 
O hacia abajo, por influencia de esa consonante (Fig. 5-15). 

Esto ocurre en la transición consonante-vocal, si es una 
sílaba directa, o vocal-consonante, si es una sílaba 
inversa. Estas rápidas inclinaciones formánticas causadas 
| por la presencia de una consonante se conocen como 
EEE] transiciones de los formantes y constituyen una pista 
Figura 5-15, Espectrograma de Japa/. Transiciones de Claye para su identificación. Esto es especialmente 


los formantes vocálicos por influencia de las conso- h . 
nantes. Compárese el espectrograma de /a/ con el de evidente en las consonantes oclusivas. 


[pa/. En este último, la porción inicial de los forman- A a Ñ 
tes son «empujados» hacia abajo por influencia de /p/ En particular, las transiciones de Fl y F2 son cruciales 
(flecha). Sai ó 
para percibir las consonantes, sobre todo las de F2 (Fig. 
5-16). 
Ñ Ñ Nuestro sistem rcepti l 11 r 
Pd sistema percept de A pa de ellas e a 
' identificar con gran rapidez los distintos sonidos 
JU JU PI 8 p 


consonanticos que van apareciendo en el habla fluida. 


Ibal Ida/ Igal o . , 
En unos casos las transiciones son hacia arriba, más o 


Figura 5-16. Las transiciones formánticas son clave MENOS pronunciadas, y en otros, son hacia abajo, 
pa dependiendo de cada consonante y, muy importante, 
también de la vocal. No hay una relación simple del tipo: todas las /d/ darán lugar a una 
transición hacia arriba, todas las /k/ causarán transiciones hacia abajo. La relación es mucho 
más compleja, pero nuestro sistema perceptivo se encuentra cómodo en esa complejidad 
porque no se equivoca. 

Veamos el ejemplo que siempre se cita en los manuales sobre percepción del lenguaje. En la 
figura 5-17 se presentan dos espectrogramas esquemáticos de las sílabas /di/ y /du/. 

Son representaciones muy estilizadas obtenidas a partir de 
los espectrogramas naturales. Cuando se pasan por el 
sintetizador de voz Pattern Playback, u otro similar, suenan 
sin lugar a dudas como /di/ y /du/, respectivamente, aunque 
lo hacen con una voz «robótica» poco natural. La parte 


Fi ia A rsi lí ae lorá rimer ., 
tormantes. Ejemplo de ausencia de invanansa acustico Estable de los formantes da lugar a la percepción de las 


En las dos sílabas (/di/, /du), el primer sonido suena /d/ a 


pesar de que las transiciones formánticas son distintas. vocales: F1 y F2 muy separados para la 11/, y juntos para la 
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/u/. Son las transiciones las que nos hacen oír la consonante /d/ en los dos casos. ¿Qué tienen 
en común las transiciones para que oigamos lo mismo? Aquí se plantea un problema, porque 
la transición de F2 es distinta en cada sílaba, pero en ambos casos suena igual: /di (si se oye 
junto con F1). No hay un patrón de energía común que sea responsable de la percepción de 
/d/. Este ejemplo ilustra el gran problema teórico sobre la percepción del habla mencionado 
anteriormente: la ausencia de invarianza acústica. Es decir, la ausencia de algo constante en 
la representación espectrográfica que corresponda a una consonante particular. Es un 
problema que causó perplejidad en los estudios pioneros y ha traído de cabeza a los in- 
vestigadores durante varias décadas, porque no hay que olvidar que ese «algo constante» sí 
lo encuentra nuestro sistema perceptivo (si no, no oiríamos la misma consonante). De la 
diversidad de explicaciones propuestas se han derivado diferentes teorías sobre la percepción 
del lenguaje. 

Percepción categórica 

Ya se ha indicado que las vocales se perciben de modo continuo: cambios graduales y 
continuos de las frecuencias de los formantes se perciben de forma continua. Por el contrario, 
las consonantes, especialmente las oclusivas (/p/, /t/, /k/, /b/, /d/, /g/), se perciben de forma 
categórica. Los cambios continuos y graduales de los sonidos consonanticos no son 
percibidos de modo continuo, sino de forma discreta o por categorías. 

El estudio seminal de Liberman, Harris, Hoffman y Griffith (1957), realizado en los 
laboratorios Haskins, fue el primero que lo puso de manifiesto. Sintetizaron una serie de 14 
estímulos formados por representaciones esquemáticas de F1 y F2 para ser escuchados por el 
Pattern Playback (Fig. 5-18). 


1 2 3 4: 5 6 7 8 910 1112 13 14 


papa pa paa a a a a 


Figura 5-18. Percepción categórica de las consonantes. Los estímulos 1 a 4 se oyen como /be/; los estímulos 5 
a 9 como /de/, y los estímulos 10 a14 como /ge/. Dentro de cada grupo no se perciben diferencias. Tomado de 
Liberman, Harris et al. (1957). 


Todos los estímulos eran iguales excepto en la transición de F2, que variaba de forma 
gradual desde un inicio bajo hasta un inicio alto (un ejemplo de estímulo completo es el 14 
de la Fig. 5-18). Al pasarlos por el sintetizador de voz, la mayoría de los participantes 
percibían ejemplos claros de /be/, /de/ y /ge/, pero no lo hacían de modo continuo, sino 
categorial. Vamos a explicarlo. La parte estable de los formantes corresponde a la vocal, /e/, 
mientras que las transiciones son debidas al efecto de la consonante. Según la inclinación de 
F2 se oye una consonante u otra, hecho que ya era sabido. Cuando F2 tiene un inicio bajo, se 
oye /b/ (estímulo 1); si el inicio es intermedio, en el mismo plano que la vocal, se oye /d/ 
(estímulo 8); si el inicio es alto (estímulo 14) se oye /g/. Pero ¿qué ocurre con los estímulos 
intermedios? Aquí está el meollo de la cuestión; si la percepción fuera continua como en las 
vocales, se percibirían formas intermedias de las tres consonantes, pero no sucede así. Los 
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estímulos 1 a 4 se oyen /be/, y siempre con la misma consonante, sin diferencias entre ellos; 
los estímulos 5 a 9 se oyen como ejemplos idénticos de /de/, y los estímulos restantes, 10 a 
14, como ejemplos idénticos de /ge/. O sea, es como si existieran valores críticos o fronteras 
en la dimensión estudiada -transición de F2-, de forma que, al cruzar de un lado a otro, 
pasáramos de una categoría de sonido a otra y, muy importante, sin diferencias internas 
dentro de cada categoría. 

Los experimentos que estudian la percepción categórica utilizan dos tipos de tareas, cuyos 
resultados se comparan entre ellas: tareas de discriminación y tareas de identificación: 

+ En las tareas de discriminación los estímulos se comparan entre sí. Hay varios paradigmas 
experimentales posibles. Así, en el paradigma denominado AX se presenta un estímulo y a 
continuación otro, que puede ser el mismo estímulo repetido u otro distinto; la tarea del 
oyente consiste en responder «igual» o «diferente». En un diseño ligeramente más complejo, 
ABX, se presentan dos estímulos sucesivos que siempre son distintos (y así se indica en las 
instrucciones); a continuación se presenta un tercer estímulo que siempre es uno de los dos 
anteriores: el oyente debe decidir cuál de los dos es este tercer estímulo. Las tareas pueden 
resultar más fácil o difícil manipulando ciertas variables, entre ellas el tiempo que media 
entre los estímulos. 

* En la tarea de identificación se presenta un único estímulo en cada ensayo y el oyente debe 
identificarlo indicando la etiqueta o nombre del estímulo; en este caso, de qué consonante se 
trata. 

Por supuesto, en ambos tipos de prueba los estímulos se presentan en ensayos aleatorios, 
para evitar cualquier efecto de orden. Cuando la percepción es de tipo categórico, la 
identificación es constante dentro de una categoría (casi el 100% de los oyentes identifican 
todos los estímulos con la misma etiqueta) y al cambiar de categoría, la etiqueta cambia 
también bruscamente. 

La discriminación guarda relación con la identificación: dentro de una misma categoría los 
estímulos son difícilmente discriminables entre sí y las repuestas rozan el nivel de azar 
(50%); cuando los estímulos que se comparan pertenecen a categorías distintas, la 
discriminación es casi perfecta (próxima al 100 %). Es decir, hay una discontinuidad en los 
resultados: error dentro de la misma categoría, y desempeño casi perfecto entre categorías 
distintas. Este «todo o nada» no aparece en la percepción continua, donde los resultados son 
proporcionales a la distancia entre los estímulos (cuanto más distintos, mejor se discriminan). 
¿Por qué los sonidos del habla, en concreto las consonantes oclusivas, se perciben de forma 
discontinua o categórica, al contrario que otros muchos sonidos, que son percibidos de modo 
continuo (p. ej., tonos)? Se ha discutido mucho al respecto, y los autores defensores de un 
mecanismo especial para la percepción del lenguaje han visto en ello una constatación de su 
existencia. Esta cuestión volverá a abordarse al tratar las distintas teorías sobre la percepción 
del habla. Lo cierto es que la percepción categórica se ha hecho evidente no sólo respecto a 
las transiciones de F2, sino también en relación con otras dimensiones acústicas relevantes 
para la distinción entre consonantes, por ejemplo el contraste sordo-sonoro. 
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Contraste sordo-sonoro 

El parámetro «estrella» en la investigación psicolingúística sobre percepción del lenguaje es, 
sin duda, el conocido como voice onset time o VOT. El término se ha traducido al castellano 
de múltiples formas: tiempo hasta el inicio de la voz, tiempo de emisión de voz, TEV, 
tiempo de emisión vocálica, intervalo de inicio de sonoridad, etc.; aquí conservaremos su 
denominación original, el acrónimo VOT, por la universalidad de su uso. De su valor 
depende que percibamos una oclusiva sorda o una sonora. Prácticamente todas las lenguas 


del mundo tienen consonantes oclusivas, aunque su 
agrupadas por parejas de sorda-sonora distribución varía de unas a otras. En la tabla 5-1 se 
Labíales Dentales Velares muestran las seis oclusivas del castellano, organizadas 
Sordas lo! It! [k1 según su punto de articulación (labial, dental, velar) y 
Sonoras /b] ld] l9/ sonoridad (sorda, sonora). 
Para entender cómo afecta el VOT a la percepción, hay que revisar antes la mecánica 
articulatoria de las consonantes oclusivas. Cuando pronunciamos una de ellas, por ejemplo 
en posición inicial de sílaba, hay una secuencia de los siguientes movimientos articulatorios: 
+ Movimiento 1: oclusión o interrupción completa, durante varias decenas de mili- 
segundos, de la salida de aire de la boca y, por lo tanto, de la energía acústica. La oclu- 
sión se realiza con los labios en las consonantes labiales /b/ y /p/, con la lengua contra 
los dientes en las dentales castellanas /t/ y /d/ o con la parte posterior de la lengua 
contra el velo del paladar en las velares /g/ y /k/. 
+ Movimiento 2: liberación del aire. Los órganos fonadores se separan bruscamente 
liberando el aire a presión y dando lugar a una pequeña explosión. 
+ Movimiento 3: comienzo de vibración de las cuerdas vocales para el inicio de la vocal 
que sigue a la oclusiva. 
Los estudios demuestran que existe una sincronización temporal muy fina, de milisegundos, 
entre estos tres movimientos a pesar de que pertenecen a grupos musculares y nervios 
craneales distintos. Esta perfecta coordinación, cuyo mecanismo responsable probablemente 
se ubica en el área de Broca de la corteza cerebral, puede verse alterada en ciertos trastornos 
del habla. La diferencia perceptiva entre /b/ y /p/ o entre /d/ y /t/ o entre /g/ y /k/ está 
determinada por la relación temporal entre los movimientos 2 y 3. Son pares de fonemas que 
son iguales en todos sus rasgos, salvo en el de la sonoridad. 
El VOT es la distancia temporal entre los movimientos 2 y 3. Es decir, los milisegundos que 
transcurren desde la liberación brusca del aire hasta el inicio de la vibración de las cuerdas 
vocales. Tomando el movimiento 2 como cero, el VOT puede ser positivo o negativo. Por 
ejemplo, un VOT de +45 ms significa que primero se produce el movimiento 2 (liberación de 
aire y explosión) y 45 ms más tarde ocurre el movimiento 3 de comienzo de la vibración. Un 
VOT de O ms indica que ambos movimientos coinciden en el tiempo. Cuando el orden se 
invierte y el movimiento 3 precede al 2, lo cual es muy frecuente en algunos idiomas como el 
español o el tai, se habla de un VOT negativo. Un VOT de -25 ms indica que primero ocurre 
el movimiento 3 y, al cabo de 25 ms, se produce el movimiento 2; en este caso, las cuerdas 
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vocales comienzan a vibrar antes de la liberación del aire, como sucede cuando 
pronunciamos la /b( en castellano. 

Las oclusivas sordas (/p/, /t/, /k/) se diferencian de las sonoras (/b/, /d/, /g/) en que tienen un 
VOT más largo que éstas. En la mayoría de las lenguas existe una distinción entre oclusivas 
sordas y sonoras según el VOT. De todos los valores numéricos que podría adoptar el VOT 
en un continuo temporal, hay límites críticos que sirven de frontera entre las categorías 


(Lisker y Abramson, 1964). En este sentido, el inglés se comporta de distinta manera que el 
castellano (Tabla 5-2). 


Tabla 5-2. Valores límite del parámetro VOT (voice onset time) que marcan la separación 


entre categorías de oclusivas labiales en tres lenguas distintas 


Inglés Sonoras ¡ Sordas 
Castellano Sonoras ñ Sordas 
Tai Presonoras A Sonoras Ñ Sordas 


-50 -40 -30 -20 -10 0 +10 +20 +30 +40 +50 


Los números indican milisegundos. 


Así, en inglés la frontera de las labiales se sitúa en torno a 25-30 ms: la consonante sorda 
(/p/) tiene un VOT superior a ese límite, y la sonora (/b/) inferior. En castellano, el límite se 
sitúa en torno a un VOT de O ms. Algunas lenguas, como el tai, tienen tres categorías 
distintas: a las categorías de sorda y sonora se añade una tercera denominada pre-sonora. 

Uno de los trabajos más citados sobre la percepción del VOT es el estudio pionero de 23 
Abramson y Lisker (1967), también de los laboratorios Haskins. Los autores crearon una 
serie de 31 estímulos artificiales para ser escuchados a través del Pattern Playback iguales en 
todo, salvo en el valor del VOT. Este variaba en pasos de 10 ms desde -150 hasta +150 ms. 

Los resultados mostraron que la percepción era claramente categórica. Las respuestas en la 
tarea de identificación se distribuían como se muestra en la figura 5-19. 
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Figura 5-19. Respuestas en una tarea de identificación (consonante B frente a P) de estímulos artificiales de 
habla, cuyo VOT varía desde -150 a +150 ms, en incrementos de 10. Las respuestas presentan una distribución 


claramente categórica, con una estrecha zona de incertidumbre en torno al «límite de VOT= +25-30 ms. Datos 
basados en Abramson y Lisker (1967). 


Cuando el VOT era inferior a 25-30 ms, casi el 100 % de las respuestas identificaban los 
estímulos como la consonante /b/; cuando el VOT era superior a ese límite, casi el 100 % de 
las identificaciones eran para la consonante /p/. Sólo en las inmediaciones del límite aparecía 
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una estrecha zona de incertidumbre, en la que las respuestas se repartían entre ambas 
categorías. Por otra parte, los datos de la tarea de discriminación indicaban que los oyentes 
tenían dificultades para distinguir entre pares de estímulos dentro de una categoría, mientras 
que las discriminaciones eran casi perfectas cuando los estímulos cruzaban la frontera, es 
decir, pertenecían a categorías distintas. 
Se ha discutido mucho sobre si hay percepción categórica en otros sonidos que no sean del 
habla y, de hecho, en ciertas condiciones, algunos estímulos de no-habla se perciben de 
forma discontinua, como se verá más adelante. Por otra parte, trabajos más recientes indican 
que los oyentes sí pueden percibir diferencias entre los estímulos de una misma categoría 
fonética y que ésta cuenta en su interior con una rica estructura interna organizada en torno a 
representaciones prototípicas (Miller, 1994). 
Parece que la percepción categórica confiere al oyente la ventaja de centrarse en los aspectos 
de la señal que son importantes para identificar los fonemas e ignorar variaciones no 
esenciales dentro de la categoría fonética. En palabras de Ryalls (1996, p. 54): 
La percepción categórica es característica de ciertas distinciones de sonidos del 
habla y generalmente no se la encuentra en los sonidos de no-habla. Se cree que 
representa uno de los modos en que el sistema perceptivo humano se ha adaptado 
especialmente a la percepción del habla. Representa una forma de manejar la enorme 
variación entre las diferentes producciones del mismo sonido que típicamente 
encontramos en el habla humana. Nos proporciona un medio para manejar esta 
variación en tiempo real -las diferencias irrelevantes entre distintas producciones del 
mismo sonido de habla se ignoran con el fin de acelerar el proceso de 
reconocimiento. De otro modo, tendríamos que emplear mucho tiempo en decidir qué 
fonemas asignamos a ciertos sonidos que suenan ambiguos. La percepción categórica 
evita que hagamos un enorme esfuerzo potencial en la elaboración de conjeturas, ya 
que [gracias a ella] normalmente no oímos los sonidos como ambiguos. 
Esto descargaría de trabajo al sistema perceptivo y permitiría concentrar casi todos los 
recursos cognitivos en lo que verdaderamente importa en el lenguaje: la extracción del sig- 
nificado, algo ciertamente complejo como se muestra en el recuadro 5-4. 


Recuadro 5-4. Problemas en la percepción del habla 


Percibir el habla es una tarea muy compleja que requiere unos mecanismos igualmente 
complejos. Prueba de ello es lo difícil que está resultando construir máquinas capaces de 
realizar esa tarea, a pesar del esfuerzo y dinero que desde hace tiempo se vienen invirtiendo. 
Hay varios factores que dificultan la percepción del habla: 

* Ruido ambiental: normalmente oímos las conversaciones en ambientes ruidosos (en la 
Calle, en la cafetería, etc.) en los que tenemos que separar el habla de otros sonidos. 

* Diferencias individuales: hay una gran disparidad en la forma en que pronuncian las 
palabras las diversas personas debido a las características de sus aparatos fonadores (gran 
variabilidad entre niños y adultos, hombres y mujeres) y de sus dialectos y acentos. 

* Superposición de hablas: muchas veces oímos al mismo tiempo varias conversaciones que 
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se superponen. 

* Rapidez en la producción del habla: nuestro sistema perceptivo tiene que ser capaz de 
identificar con gran rapidez los fonemas, ya que nos pueden llegar unos 20-30 por segundo. 
* Rápido desvanecimiento del habla: contrariamente a la lectura, en la que las palabras 
permanecen antes nuestros ojos todo el tiempo que queramos, en la percepción oral las 
palabras se desvanecen muy rápidamente. 

Pero hay sobre todo dos factores que convierten la percepción del habla en una tarea suma- 
mente compleja: 

+ El problema de la continuidad: el habla es continua y no segmentada en palabras. 

+ El problema de la ausencia de invarianza: no existe correspondencia exacta entre los 
estímulos acústicos y los segmentos fonéticos. 


PERCEPCIÓN DEL HABLA EN ANIMALES 

Muchos autores, partidarios de la existencia de un mecanismo especializado para percibir el 
lenguaje, vieron en la percepción categórica una prueba a su favor, ya que ésta surgía como 
una propiedad «especial» y típica de los sonidos del habla. Su argumentación cobró fuerza 
cuando a comienzos de la década de 1970 apareció en Science el paradigmático trabajo de 
Peter Eimas y su equipo de la Universidad de Brown, en el que se demostraba que la 
percepción categórica de algunos fonemas era innata en el ser humano y se manifestaba 
desde los primeros meses de vida (Eimas et al., 1971). Hasta ese momento había una 
creencia extendida de que los bebés, así como tienen que aprender a hablar, vienen al mundo 
sin la habilidad de percibir los sonidos del habla y tienen que adquirirla a medida que se ven 
expuestos al lenguaje. Aquel estudio y otros posteriores demostrarían, en cuanto a la 
percepción del habla, que los seres humanos no nacen como una hoja en blanco. 

El descubrimiento de que los recién nacidos perciben los sonidos del habla de forma 
categórica, como lo hacen los adultos, supuso un fuerte apoyo a la tesis de los 
«especialistas», que abogan por un mecanismo perceptivo específico para el lenguaje, frente 
a los «generalistas», defensores del mecanismo general de la percepción auditiva. Sin 
embargo, como señalamos previamente, la evidencia empírica se ha ido repartiendo a favor 
de ambas posiciones teóricas y la euforia de los especialistas fue corta. 

Cuatro años más tarde del trabajo de Eimas con los bebés, Patricia Kuhl y James Miller de- 
mostraron que la percepción categórica también ocurre en sujetos tan poco sospechosos de 
tener lenguaje humano como las chinchillas. La chinchilla (Chinchilla laniger) es un pequeño 
mamífero, cuyo oído presenta importantes similitudes con el humano, motivo por el cual se 
utiliza bastante en experimentos sobre audición. En su trabajo, publicado en Science, Kuhl y 
Miller (1975) pusieron a prueba cómo percibían estos animalitos sílabas formadas por una 
oclusiva dental (/t/ o /d/) y la vocal /a/. Los estímulos fueron sintetizados artificialmente y 
formaron una serie que variaba en VOT desde O ms (que se percibe como una /d/ inglesa) 
hasta 80 ms (que se percibe como una /t/ inglesa), en pasos sucesivos del mismo tamaño. El 
experimento consistió en dos fases: 
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+ En la fase de entrenamiento, las chinchillas fueron divididas en dos grupos y se utili- 
zaron sólo los dos estímulos extremos de la serie. Un grupo aprendió a responder ante 
los estímulos de VOT = O ms cruzando una barrera que dividía la jaula para evitar una 
descarga eléctrica suave y un sonido molesto, y a permanecer en el mismo lado ante 
los estímulos de VOT = 80 ms, en cuyo caso eran recompensadas con agua para beber. 
El otro grupo recibió el mismo entrenamiento, pero con los estímulos invertidos. 

+ Cuando las respuestas de ambos grupos a los dos estímulos extremos fueron perfectas, 
se pasó a la fase de prueba. Ahora los animales eran enfrentados a toda la serie 
completa de estímulos, con todos los grados intermedios de VOT entre O y 80 ms. Los 
dos estímulos extremos fueron castigados o recompensados como antes, pero los 
intermedios fueron siempre recompensados. 

Este diseño mimetizaba bien los experimentos típicos de identificación con seres humanos, 
en los que habría dos respuestas posibles (sonidos /t/ y /d/) y los estímulos presentarían toda 
la gama de posibilidades intermedias. También la chinchilla tenía dos respuestas para acoger: 
cruzar la barrera o permanecer en el mismo lado. Lo sorprendente del experimento fue que 
las respuestas de las chinchillas fueron muy semejantes a las humanas ante los mismos 
estímulos. La percepción resultaba también categórica y el límite o punto intermedio de 
cruce entre las dos categorías se situó en VOT = 33 ms, mientras que en los seres humanos 
(nativos del inglés) fue en torno a 35 ms. Además, en un trabajo posterior, Kuhl y Miller 2 6 
1978) comprobaron que las fronteras entre categorías variaban igual que en las personas, 
dependiendo del punto de articulación de las consonantes. En las labiales (/b/ frente a /p/), el 
límite estaba en torno a un VOT = 25 ms, tanto en los seres humanos como en las chin- 
chillas, y en las velares (/g/ frente a /k/), sobre un VOT = 42 ms, también para ambos. 

Con los mismos estímulos, Dooling, Okanoya y Brown (1989) obtuvieron años más tarde 
resultados parecidos en periquitos (Melopsittacus undulatus) Con otros estímulos 
lingúísticos se han hallado asimismo paralelismos entre las respuestas humanas y las de otros 
animales como codornices japonesas (Coturnix coturnix japónica) o monos macacos 
(Macaca mulata y M. muscata). 

Se asestaba así un duro golpe a la percepción categórica como manifestación o prueba de un 
mecanismo especial humano. Algunos de sus máximos partidarios habían declarado con 
anterioridad (Liberman, Mattingly y Turvey, 1972, p. 324): «Presumiblemente, a ellos [los 
animales] les falta el procesador necesario para decodificar la señal de habla. Si es así, su 
percepción del habla debe ser muy diferente de la nuestra. Por ejemplo, no deberían oír 
categóricamente». 

Los resultados procedentes de los animales no invalidan per se la posible existencia de un 
mecanismo especial en las personas, pero restan peso al argumento que había sido su buque 
insignia: la percepción categórica. Esta podría explicarse como una propiedad general del 
sistema de audición de mamíferos y aves (vertebrados) (Recuadro 5-5), que presentaría 
discontinuidades o diferencias de sensibilidad en su capacidad de discriminar eventos 
temporales, como los que están implícitos en el VOT de las oclusivas. 
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Recuadro 5-5. Capacidad de las ratas para discriminar lenguas 


Un trabajo realizado en la Universidad de Barcelona y publicado en Animal Cognition ha 
causado cierto revuelo en los medios internacionales por su impacto teórico (Toro, Trobalón 
y Sebastián-Galles, 2003). Los autores comprobaron que mamíferos tan alejados 
evolutivamente de los primates como las ratas tienen la capacidad de discriminar lenguas 
por su estructura rítmica y entonacional. Como estímulos se usaron frases artificiales 
sintetizadas en japonés y holandés, dos lenguas de estructuras prosódicas muy distintas. 

Se emplearon 64 ratas del tipo Long-Evans. En una primera fase, un grupo fue entrenado 
para apretar una palanca cada vez que oía una frase en japonés y a no hacerlo cuando era en 
holandés. Otro grupo fue entrenado a la inversa. En una segunda fase (fase de prueba), la 
ratas fueron expuestas a un conjunto nuevo de frases que no habían oído previamente. Los 
datos mostraron que los roedores eran capaces de generalizar su aprendizaje a través de 
frases distintas, reconociendo las peculiaridades rítmico-prosódicas de cada lengua. En otra 
condición se comprobó que si las frases se administraban en sentido inverso (habla inversa), 
de atrás adelante, en el que se pierde la estructura prosódica de cada lengua, las ratas no 
discriminaban correctamente entre japonés y holandés. La discriminación también era 
posible si, en vez de estímulos artificiales, se usaban frases naturales grabadas a partir de un 
único hablante, pero no cuando intervenían hablantes distintos en una misma lengua. 

Estos resultados son semejantes a los obtenidos en experimentos anteriores con monos 
tama-rinos (Ramus, Hauser, Miller, Morris y Mehler, 2000), pero nunca se había explorado 
esta cuestión en un mamífero tan filogenéticamente distante. Parece que existen habilidades 
que los seres humanos usamos para percibir el lenguaje que son compartidas por todos los 
mamíferos. Por supuesto, las ratas no han desarrollado su capacidad de captar señales 
prosódicas por razones lingúísticas, como los seres humanos, sino que probablemente es el 
subproducto de otras capacidades auditivas que sí tienen valor adaptativo en su repertorio 
comportamental. Algunos autores, desde un enfoque generalista, defienden que tal vez el 
lenguaje surgió y se aprovechó de ciertas capacidades perceptivas preexistentes comunes a 
todos los mamíferos y quizás a otros vertebrados. En esta línea van también ciertos 
resultados experimentales con sonidos no lingúísticos. 
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Por otra parte, se ha observado percepción categórica en sonidos que no son de habla 
(Recuadro 5-6). 


Recuadro 5-6. Percepción de sonidos de no-habla 


Uno de los argumentos a favor de la posición teórica generalista es el hecho de que se ha 
observado percepción categórica en estímulos de no-habla. En general, la percepción de sonidos 
distintos del habla, como los tonos puros, es de tipo continuo, pero, en determinadas condiciones, 
su percepción puede ser categórica. 


David Pisoni, del Instituto Tecnológico de Massachusetts, comprobó que ciertas tareas percep- 
tivas con tonos simples presentaban fronteras semejantes a las del VOT de las oclusivas (Pisoni, 
1977). Los estímulos estaban formados por dos tonos simultáneos, uno agudo y otro grave, cuyos 
respectivos comienzos variaban entre sí de unos estímulos a otros. Pisoni creó una serie de 11 
pares tonales con diferencias entre sus comienzos que iban desde -50 ms (el tono grave comen- 
zaba 5 ms antes que el agudo), hasta +50 ms (el tono grave comenzaba 50 ms después que el 
agudo), en incrementos de 10 ms (Fig. 5-20). 
Sometió primero a los participantes durante 
dos días a una fase de entrenamiento para 
que aprendieran a categorizar (identificar) 
los dos estímulos extremos de la serie (-50 
y +50 ms). Se trataba de asignarles una 
etiqueta o nombre distinto a cada uno de 5 
ellos. Una vez conseguido un buen desem- -50 ms 
peño, los oyentes se enfrentaron a la serie Tiempo (asincronías entre inicios) 
completa de los 11 estímulos en una tarea 
de identificación y otra de discriminación. La Figura 5-20. Ejemplos de estimulos del experimento 
discriminación se basó en el paradigma ABX, — de Pisoni (1977). Consisten en un par de tonos puros, 
que, como ya se ha explicado, consiste en la uno alto y otro bajo, cuyos comienzos varían entre 
presentación sucesiva de tres estimulos, de sí de unos estimulos a otros. La serie completa com- 
los cuales, los dos primeros son distintos, y el prendía 11 estímulos con las siguientes asincronías 
tercero siempre es uno de los dos anteriores; — €ntre los tonos: -50, -40, -30, -20, -10, O, +10, +20, 
la tarea consiste en determinar cuál de ellos. — +30, +40, +50 ms, Adaptado de Pisoni (1977). 
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Los resultados indicaron que la identificación había sido más de tipo categórico que continua. 
En cuanto a la tarea de discriminación, lógicamente es esperable que cuanto más separados estén 
dos estímulos entre sí a lo largo de la serie, mejor serán discriminados. Sin embargo, los datos no 
mostraron una función continua, sino que aparecía un brusco incremento en torno a diferencias 
temporales de -20 ms y +20 ms. Estos límites coinciden con las fronteras que el parámetro VOT 
presenta en muchas lenguas entre consonantes oclusivas. La interpretación de Pisoni es que tales 
resultados son congruentes con el hecho de que 20 ms es la diferencia mínima necesaria para poder 
identificar el orden temporal de dos eventos (Stevens y Klatt, 1974): estímulos con diferencias entre 
sus comienzos mayores a 20 ms son percibidos como sucesivos, mientras que los estímulos con 
asincronías inferiores a ese límite se perciben como simultáneos. Para estos autores y otros (Diehl, 
Lotto y Holt, 2004), la percepción categórica sería un reflejo de una limitación del sistema auditivo 
para discriminar intervalos temporales por debajo de ese umbral psicofísico. 


En otros trabajos, como el de Mirman, Holt y McClelland (2004), con sonidos de no-habla más 
complejos que tonos puros, se observó que la percepción depende de su naturaleza acústica. Si 
los estímulos tienen una estructura con frecuencias rápidamente cambiantes -como sucede en el 
habla a las consonantes oclusivas- se perciben de modo más claramente categórico que cuando 
tienen una estructura con frecuencias estables, más parecida a la de las vocales. 


TEORÍAS SOBRE LA PERCEPCIÓN DEL HABLA 

La forma en que los oyentes consiguen pasar de una señal acústica continua y 
extremadamente variable a representaciones estables y discretas como los fonemas es algo 
que ha recibido explicaciones distintas desde diversas posiciones teóricas. El principal 
escollo que debe sortearse es la aparente ausencia de invarianza acústica que, como se ha 
mencionado, presentan muchos sonidos del habla. A continuación se exponen las tres 
perspectivas teóricas más influyentes. 
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+. Teoría motora 
Es la teoría más antigua de todas y, en sus distintas versiones, sigue teniendo vigencia hoy. 
Fue propuesta desde los Laboratorios Haskins en la década de 1950 por Alvin Liberman, 
Franklin Cooper y Pierre Delattre, en un intento de explicar la ausencia de invarianza 
acústica del habla. 
Si retomamos como ejemplo la figura 5-17, es sorprendente que en ambos estímulos el 
primer sonido suene /d/, pese a que los espectrogramas no tienen aparentemente nada en 
común. En uno, la transición del segundo formante (F2) es hacia abajo, y en el otro es hacia 
arriba. Sin embargo, «algo» hay en común que nuestro sistema perceptivo es capaz de 
capturar al percibir la misma oclusiva dental en ambos casos. Para esta teoría, ese «algo» 
común no hay que buscarlo en el plano acústico de las ondas o los espectrogramas, sino en el 
plano motor de los movimientos articuladores que son el origen de los sonidos del habla. 
Aunque /di/ y /du/ son estímulos sin energía acústica común, los dos comparten el hecho de 
que se han pronunciado del mismo modo; es decir, los movimientos y las órdenes motoras 
emanadas del cerebro han sido los mismos básicamente: por unos breves instantes, la lengua 
obstruye firmemente el paso del aire presionando contra los dientes superiores y lo libera 
retirándose bruscamente en busca de una nueva posición para producir la vocal siguiente (/i/ 
en un caso, /u/ en el otro). 
De este modo, según la teoría motora, el verdadero objeto de la percepción no es la señal 29 
acústica en sí, sino los movimientos articulatorios y las órdenes motoras que el cerebro envía 
a los órganos articuladores para producir el habla (Liberman, 1985). Estas órdenes motoras 
serían invariables para cada fonema y tendrían la constancia que no aparece en la señal. Los 
oyentes dispondrían de un módulo o decodificador especializado en reconstruir los gestos 
motores a partir de la señal acústica. No hay que olvidar que los oyentes son también 
hablantes y, por lo tanto, disponen en su cerebro de toda la maquinaria neural necesaria para 
producir lenguaje. Ellos podrían utilizar toda O parte de esta maquinaria para la 
reconstrucción de los gestos articulatorios. Esta teoría plantea que los oyentes se sirven de 
sus mecanismos de producción para percibir el lenguaje. 
Según sus defensores, la capacidad humana para percibir los sonidos del habla no puede ser 
explicada en términos de un mecanismo general de audición o de aprendizaje perceptivo, 
sino que depende de un decodificador especializado en lenguaje que es único y propio de los 
seres humanos. En palabras de Liberman y Mattingly (1985, p. 26), este decodificador 
«incorpora información completa sobre las características anatómicas y fisiológicas del 
tracto vocal y también sobre las consecuencias acústicas y articulatorias de los gestos 
lingúísticamente significativos». 
Algunas de las evidencias a favor de la teoría motora se sitúan en la innegable relación que 
existe entre los procesos de producción y percepción del lenguaje. Por ejemplo, como señala 
Ryalls (1996), no es difícil ver a un extranjero mover sus labios mientras intenta comprender 
las palabras de un lenguaje que no le es familiar. O el hecho de que muchas personas con 
sordera profunda pueden «leer» el habla a partir de los gestos visibles articulatorios de los 
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demás. Otra evidencia a favor de la unión entre la producción y la percepción es el conocido 
efecto McGurk, nombrado así a partir de uno de los autores que lo observó por primera vez 
(McGurk y MacDonald, 1976). En virtud de este efecto, los oyentes combinan información 
visual sobre la producción del habla con información auditiva. Si se muestra un vídeo con la 
Cara de una persona pronunciando la sílaba velar /ga/ y simultáneamente por el altavoz se 
presenta la sílaba labial /ba/, lo que ocurre es que el oyente percibe un fonema con un punto 
de articulación intermedio entre ambos: el dental /da/. Es decir, integra en una representación 
común información procedente de modalidades distintas, visual y auditiva. Para la teoría 
motora esta representación común estaría en un plano neuromotor. 
Más recientemente, los estudios con imágenes por resonancia magnética funcional sugieren 
que el cerebro activa zonas motoras del habla mientras percibe el lenguaje (D'Ausilio et al., 
2011; Wilson et al., 2004). 

+ Teoría realista directa 
En la década de 1980 se planteó una alternativa a la teoría motora, referida como la teoría 
realista directa. Esta teoría, desarrollada por Carol Fowler también desde los Laboratorios 
Haskins, plantea igualmente que el objeto de la percepción es de tipo articulatorio o motor, 
pero no supone que el oyente deba tener acceso a su sistema de producción para reconstruir 
los gestos fonéticos (Fowler, 1996). Asimismo, niega la existencia de un módulo 
especializado en decodificar el lenguaje. 30 
Su base es la perspectiva ecológica de la teoría de la percepción directa desarrollada por el 
psicólogo James Gibson. El enfoque gibsoniano ha tenido gran influencia en la psicología de 
la percepción y se dirige a todas las modalidades sensoriales. Al contrario que las restantes 
teorías de la percepción, que presuponen una secuencia de estadios de procesamiento a partir 
del estímulo de entrada, Gibson considera que la propia estructura del estímulo ya incorpora 
toda la información necesaria para percibir los objetos y eventos del entorno. Los animales 
—y las personas— perciben de forma directa todos los elementos de su medio ecológico que 
son relevantes para su supervivencia. La percepción es un proceso «directo», sin necesidad 
de pasos intermedios, y no el fruto de una «construcción» o elaboración como propugnan las 
demás teorías. Gracias a la evolución, los sistemas sensoriales ya están, según Gibson, 
perfectamente calibrados para captar el mundo físico en que se desenvuelven. La obra de 
Gibson, especialmente su libro de 1979 The ecological approach to visualperception, ha 
causado un gran impacto en la comunidad científica pero tampoco ha estado exenta de 
críticas. 
Fowler entiende que la percepción del lenguaje puede caracterizarse en los mismos términos 
que, por ejemplo, la percepción visual de las superficies de objetos. Así, en el caso de la 
visión, la luz reflejada por las superficies de los objetos sirve de estímulo cercano o 
proximal, cuya propia estructura ya proporciona información directa sobre los objetos del 
entorno, o estímulos distales. De la misma forma, la señal acústica es un estímulo proximal 
que proporciona información sobre los estímulos distales, o gestos artículadores que la han 
producido. Cuando un oyente escucha el lenguaje capta de forma directa los movimientos 
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articulatorios que lo han producido, pero no gracias a un mecanismo especial para el 
lenguaje, sino del mismo modo en que percibe el origen de otros sonidos de su entorno. 
La principal crítica que ha recibido la teoría realista directa se dirige contra la hipótesis de 
que los objetos propios de la percepción del lenguaje sean los gestos articulatorios. Este 
reparo procede principalmente de quienes defienden la teoría auditiva general. Por otra parte, 
muchos autores contraponen ejemplos en los que existe percepción sin conocimiento directo 
de las causas distales; así, alguien puede escuchar música, percibir la melodía de, por 
ejemplo, un violín, sin conocer dicho instrumento, su estructura o material del que está 
hecho. 

* Teoría auditiva general 
Como hemos visto, varios hallazgos pusieron en cuestión la teoría motora de la percepción 
del habla y la existencia de un mecanismo específico. Los principales hallazgos se han 
mencionado anteriormente; nos referimos a la evidencia de percepción categórica por parte 
de animales no humanos (Kuhl y Miller, 1975, 1978), así como a ciertos estímulos de no- 
habla Pisoni, 1977). Estos y otros autores mantienen que los mecanismos perceptivos 
generales de la audición son los responsables de la percepción del lenguaje. En contraste con 
la teoría motora, no se presupone la existencia de mecanismos específicos o de un módulo 
decodificador especial. Se asume como hipótesis de trabajo que los sonidos del lenguaje se 
perciben y dependen del sistema general de audición y de los principios del aprendizaje 
perceptivo; los mismos que han evolucionado en los seres humanos para manejar otras clases 
de sonidos del entorno. 
Por otra parte, la percepción del lenguaje no está mediada ni se basa en la percepción de 
gestos articuladores. La paradoja de las sílabas /di/ y /du/ (Fig. 5-17) se explica por la 
capacidad general del oyente de hacer uso de múltiples señales acústicas imperfectas para 
categorizar estímulos complejos, como sucede en la percepción de muchos otros patrones de 
estímulos complejos. Del mismo modo que algunos autores proponen que la constancia de 
los objetos en la visión es el resultado de combinar múltiples atributos visuales, el oyente 
podría mantener la constancia perceptiva fonética haciendo uso de múltiples pistas acústicas. 
Para esta teoría, la percepción de la constancia o invarianza no requiere la recuperación de 
gestos articuladores o el concurso de ningún módulo especial. En apoyo de esta posición 
teórica, Kluender, Diehl y Killeen (1987) demostraron que los pájaros podían ser entrenados 
a responder a estímulos naturales que comenzaban por el fonema /d/ seguido de distintas 
vocales y no responder a otros que comenzaban por los fonemas /b/ o /g/. Es decir, estos 
sujetos no lingiiísticos también eran capaces de percibir la invarianza o constancia fonética 
de, por ejemplo, /di/ y /du/. 
Una derivación de la teoría general es la hipótesis de la potenciación auditiva, según la cual, 
los sistemas de sonidos de las distintas lenguas se han adaptado para convertirse en robustas 
señales que explotan las características generales del sistema auditivo. De esta manera, las 
lenguas desarrollan un inventario de fonemas que optimiza la distintividad fonética entre 
ellos, de acuerdo con las capacidades auditivas generales. 
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EFECTO DEL CONTEXTO EN LA PERCEPCIÓN DEL LENGUAJE 

El fin último de la percepción del lenguaje oral es extraer significados del sonido, pero, 
como señalamos previamente, en esta operación hay en realidad dos fuentes de información 
que fluyen al mismo tiempo (Fig. 5-21). 

Una, la más evidente, es la información acústica del 
estímulo que alimenta al sistema perceptivo-cognitivo 
Mr ql desde afuera hacia dentro o, como se representa 
| convencionalmente, de abajo-arriba; son los procesos 
referidos como bottom-up. La otra información fluye 
en sentido contrario y procede de los niveles superiores 
de procesamiento; es decir, desde las representaciones 
de naturaleza sintáctica, semántica y pragmática, que 


Procesos Procesos 


abajo-arriba arriba-abajo 
(bottom-up) (top-down) 


| | 


Procesos perceptivos 


| tienen que ver con la construcción sobre la marcha del 
Estímulo . “fo. 1 
significado de lo que escuchamos. Este es el conocido 


Figura 5-21. Procesamiento abajo-arriba (bottom- 


up) y procesamiento arriba-abajo (top-down), dentro 
de la arquitectura general del sistema perceptivo- 
cognitivo. 


efecto del contexto y corresponde a procesos de arriba- 
abajo o top-down. Los modelos artificiales de 


procesamiento computacional pueden simular 
razonablemente bien los primeros, pero tienen serias dificultades con los segundos. Aquí 
reside, precisamente, una de la principales potencialidades de los sistemas naturales o 
humanos. 

+ Restauración fonémica 

La demostración más contundente del efecto del contexto sobre la percepción del lenguaje es 
el conocido fenómeno de la restauración fonémica (Warren, 1970). 
En un trabajo ya clásico y muy citado, publicado en Science, Richard Warren hizo escuchar 
frases completas en las que se había sustituido un segmento fonético, por ejemplo el fonema 
/s/ de la palabra «legislatura», por un sonido no lingúístico de intensidad semejante, como un 
golpe de tos o un zumbido. Cuando se les preguntó a los sujetos después de escuchar las 
frases, éstos afirmaron que habían percibido todas las palabras intactas, y muchos ni siquiera 
habían sido conscientes de la presencia del ruido intruso. Este efecto se mantenía incluso al 
repetir la grabación y una vez que los oyentes eran informados de las condiciones 
experimentales. Es decir, la información cognitiva procedente de procesos superiores 
(información de arriba-abajo) era capaz de suplir la información física ausente en la señal de 
habla y restaurar el fonema que faltaba. Este efecto no ocurría cuando se trataba de estímulos 
que no eran palabras (p. ej., «teliscura»). Además, cuando detectaban el ruido intruso, los 
participantes no podían ubicar correctamente el lugar de la frase en que había sido insertado. 
Por el contrario, si el fonema era reemplazado por un silencio en lugar del ruido, entonces no 
se producía la restauración fonémica y el silencio era detectado fácilmente. Parece como si el 
proceso de restauración fonémica necesitara algún «material de entrada» (ruido) sobre el que 
apoyarse para «reconstruir» perceptivamente el fonema ausente, y no funcionara desde la 
nada estimular (silencio). 
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Otro experimento claramente demostrativo de la restauración fonémica (Warren y Warren, 
1970) consistió en la presentación de frases como las siguientes: 

«It was found that the *eel was on the orange» [Se encontró que la *eel estaba en la 
naranja]. 

«It was found that the *eel was on the axle» [Se encontró que la *eel estaba en el eje]. 

«It was found that the *eel was on the shoe» [Se encontró que el *eel estaba en el zapato]. 
«It was found that the *eel was on the table» [Se encontró que la *eel estaba en la mesa]. 
Todas la frases fueron idénticas excepto en la última palabra. De hecho, la parte común fue 
exactamente la misma grabación, a la que se le insertó acústicamente la palabra última; de 
este modo se evitaba que diferencias sutiles en la entonación o en la pronunciación pudieran 
influir en los resultados. La palabra *eel tenía el primer fonema reemplazado por una tos, 
que aquí se representa con el asterisco. Cuando los participantes escuchaban las frases, se 
producía una restauración 'fonémica dependiente del contexto y percibían el fonema que era 
congruente con cada frase: 'peel' (pela o cascara), 'wheel' (rueda), 'heel' (talón) y 'meal' 
(carne), respectivamente. Los sujetos afirmaban que en cada caso habían oído la palabra 
completa. La pregunta es si los oyentes realmente perciben el fonema ausente o simplemente 
lo «adivinan» sin oírlo. En otras palabras, ¿se trata de un efecto genuinamente perceptivo o 
es posperceptivo? Hay evidencia de que en determinadas condiciones la restauración 
fonémica es un efecto verdaderamente perceptivo (Samuel, 1990). Los datos parecen indicar 
que la influencia de las palabras en la percepción de los fonemas es perceptiva, mientras que 
la influencia de la frase es principalmente de tipo posperceptivo. 

En el lenguaje escrito también se ha constatado una restauración grafémica, equivalente a la 
fonémica del lenguaje oral. Así, Jordán, Thomas y Scott-Brown (1999) observaron el 
fenómeno de las «letras ilusorias» en el que los participantes perciben letras donde éstas no 
existen. Utilizaron listas de palabras, algunas con la mitad de las letras reemplazadas por 
caracteres sin sentido; a los participantes se les dijo que era una prueba para estudiar la 
legibilidad de las palabras, y las listas se presentaron a cierta distancia para que 
seleccionaran las palabras que les parecían más legibles. Casi la mitad de las palabras 
escogidas como más legibles contenían caracteres extraños en lugar de letras, y lo más 
sorprendente es que los sujetos no se habían percatado de ello, pese a que los estímulos 
estaban expuestos sin límite de tiempo. Otra conocida demostración del mismo fenómeno es 
nuestra facilidad para leer texto en el que muchas L3tRA$ $0N $US$tltUlD4$ por SYMBOLOS$ 
o NUMB3RO$ que guardan un parecido con ellas (Carreiras, Duñabeitia y Perea, 2007). 

En otra línea de investigación, los trabajos con sombreado (shadowing) de frases, llevados a 
cabo por el equipo de Marslen-Wilson, ponen también de manifiesto el efecto del contexto. 
Sombrear una frase es «seguirla como una sombra», es decir, repetir sus palabras lo más 
rápido posible, según se van escuchando. Los resultados muestran que los oyentes pueden 
repetir las frases de forma más rápida cuando éstas están bien formadas desde el punto de 
vista sintáctico y semántico (Marslen-Wilson y Welsh, 1978). La repetición es mucho más 
lenta si hay que seguir secuencias desordenadas de palabras. Se trata, por lo tanto, de la 
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influencia ejercida por información procedente de los niveles superiores de procesamiento, o 
procesos arriba-abajo. 
Los datos indican que los oyentes pueden seguir las frases con latencias muy cortas, del 
orden de 250 ms, equivalente a la duración de una sílaba. Esto quiere decir que, en los vo- 
cablos polisilábicos, son capaces de reconocer una palabra incluso antes de que sea 
presentada completamente. Según muchos autores, ésta es una de las evidencias más 
convincentes sobre el efecto de la información de tipo arriba-abajo en la percepción del 
lenguaje. 

+ Efectos arriba-abajo de alto nivel 
Los procesos de alto nivel ejercen su acción desde representaciones superiores a la palabra y 
tienen lugar no sólo en el lenguaje oral, sino también en el escrito. Así, la palabra «pincel» se 
identifica más rápidamente si aparece en un texto sobre pintura, que si la leemos de forma 
aislada, o en un texto sobre, pongamos por caso, los juegos olímpicos. Por el mismo motivo, 
leemos mejor y más deprisa un texto con estructura y significado coherente, que un conjunto 
desordenado de palabras o sílabas. A título ilustrativo, compare el lector los tiempos de 
lectura de los dos textos del recuadro 5-7, teniendo en cuenta que ambos tienen exactamente 
las mismas sílabas. 


Recuadro 5-7. Efectos del contexto en la percepción del lenguaje 
Compare el lector los tiempos de lectura de ambos textos, teniendo en cuenta que los dos 
tienen exactamente las mismas sílabas, aunque en distinto orden: 


Texto 1. ¿Son perjudiciales para la salud las antenas de telefonía móvil? El tema es 
preocupante desde el punto de vista de la alarma social; lo cual no significa que exista una 
peligrosidad real. Con los conocimientos que se tienen hoy en día, nadie ha podido 
demostrar que exista una correlación entre posibles efectos perjudiciales para la salud y las 
antenas de telefonía móvil. No obstante, por un principio de precaución, conviene seguir 
investigando, por si se descubrieran nuevos efectos aún desconocidos. 

Texto 2. ¿Fecmo avilalpo aun bleste ca an cauci precicia que nenen? Raco los coque concu 
percualdad porte u toción denatade desu es diju ma diladie; do lasdos era e pael el enfec 
enes sonfi se foxis. Gan toslud groguir ha tena injuse dilanodi sitos lani lasdole vieles les 
lilocolud, y tadeta na desmien atemos cialción ninía deno la no nuelar obspa e panpe 
cuperpio po an preci. Pfinpun eiaque, con óeno hoy deenas ran rerre sase si sigso tande 
nastebrie porte mosi titie tosnitrar sa trema unves levil a vistevos xisfo. 


En el primer texto, la representación del significado que vamos construyendo al leer 
suministra información (de arriba-abajo) que nos permite anticipar sobre la marcha hipótesis 
acerca de las palabras que nos vamos a encontrar. El estímulo escrito nos va corroborando 
esas hipótesis y, en la mayor parte de los casos, no necesitamos realizar un análisis 
exhaustivo de todo el estímulo -identificar todas y cada una de las letras. En cierto modo, la 
lectura se convierte en la confirmación de hipótesis sucesivas. 

Dicho de otro modo, la naturaleza del estímulo (un discurso/texto organizado, con 
significado coherente) permite que aprovechemos información de arriba-abajo y 
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necesitemos, en consecuencia, menos información estimular de abajo-arriba. Esto no ocurre 
en el «texto» 2, en el cual todo el procesamiento debe descansar de modo exclusivo en la 
información del estímulo (abajo-arriba) y éste debe ser analizado exhaustivamente. Cuando 
lo leemos, lo hacemos sin construir ningún significado, de modo semejante a como hacen 
algunos programas de ordenador especializados en el reconocimiento del lenguaje. 
Podríamos plantear el siguiente principio con carácter general: cuanta más información de 
contexto (arriba-abajo) tengamos, menos información entrante necesitaremos del estímulo 
(abajo-arriba). 

La percepción del habla en situaciones naturales de comunicación se ve fuertemente apoyada 
por los efectos del contexto. Los primeros estudios dejaron claro que las palabras presentadas 
en un fondo de ruido se identifican mejor en el contexto de una frase que cuando se 
presentan de forma aislada. En algunos trabajos (Pollack y Pickett, 1963) (Fig. 5-22), los 
investigadores grabaron en cintas magnetofónicas conversaciones y narraciones y 
posteriormente cortaron algunos fragmentos extrayendo palabras que presentaron de forma 
aislada y desordenada. 


| 
| 


Figura 5-22. Los primeros estudios pusieron de manifiesto la importancia del contexto en la percepción del 
enguaje. Si de una narración grabada se cortan y se desordenan las palabras, sólo el 50 % de éstas se perciben 
correctamente de forma aislada 


Los resultados demostraron que sólo la mitad de las palabras aisladas se reconocían 
correctamente, mientras que en el contexto de la frase se identificaban prácticamente en su 
totalidad (Recuadro 5-8). 


Recuadro 5-8. Efectos del contexto en poblaciones especiales 

El efecto del contexto en la percepción del lenguaje tiene también implicaciones clínicas 
(Ryalls, 1996). Durante años no estuvo claro por qué muchos niños con hipoacusia o sordera 
tenían problemas no sólo para percibir el habla, sino también para leer, siendo con 
frecuencia lectores deficientes. Dado que no tenían problemas visuales, la razón no era 
obvia. Más tarde empezamos a comprender que su dificultad sensorial hace más difícil 
aprovechar información mo sólo del estímulo hablado (abajo-arriba), simo también 
información de tipo arriba-abajo o del contexto. A causa de su sordera, eran niños que desde 
el nacimiento habían estado menos expuestos a las palabras del idioma y, en consecuencia, 
tenían vocabularios más restringidos. Debido a esta experiencia lingúística más pobre, les 
resultaba más difícil construir los significados durante la lectura y aprovecharse, así, de la 
información de tipo arriba-abajo. Es importante ser conscientes de la influencia de este tipo 
de información procedente de los procesos superiores, a la hora de diseñar los programas de 
rehabilitación y tratamiento. 
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Algo semejante sucede en algunos niños normooyentes con dificultades lectoras. Los niños 
que arrastran un largo historial disléxico también tienen, como consecuencia, una 
experiencia lectora muy reducida; tienen un vocabulario lector muy pobre y escasa 
familiarización con las estructuras sintácticas de los textos, de manera que su problema es 
doble: a su dificultad perceptiva en el desciframiento de los grafemas (información abajo- 
arriba) se añade el hecho de que no pueden compensarla aprovechándose de información de 
arriba-abajo, dada su escasa experiencia lectora. 


RESUMEN 

+ El lenguaje oral o habla es sonido y, por lo tanto, consiste en un patrón de energía 
variable en el tiempo, analizable mediante el estudio de su onda acústica y su 
composición espectrográfica (espectrogramas). Ese patrón de energía ingresa en el 
sistema perceptivo humano y es procesado para extraer los fonemas de una lengua 
como paso previo para construir una representación del significado. 

+ La percepción del habla presenta unas características que la diferencian de la 
percepción de otros sonidos: es un proceso robusto, muy resistente a la degradación 
de la señal, automático, rápido y, a la vez, altamente complejo y flexible. La cuestión 
central en la psicolingúistica es si esta peculiaridad obedece a un mecanismo 
perceptivo específico, propio del lenguaje, o se trata del mismo mecanismo general de 
percepción de los sonidos aplicado sobre una señal a la que estamos sobreexpuestos a 
lo largo de la vida. 

+ En relación con la pregunta central, la percepción del habla plantea otras cuestiones 
específicas que tienen que ver con la ausencia de invarianza de la señal y la 
percepción categórica de ciertos fonemas consonanticos. La investigación 
experimental ha establecido comparaciones con la percepción del habla en animales 
(sujetos sin lenguaje) y la percepción de sonidos no lingúísticos. 

* La investigación de las últimas décadas ha destacado el papel clave que desempeñan 
los formantes del habla, o resonancias del tracto vocal, en la percepción tanto de 
vocales como de consonantes. Los intentos explicativos de los procesos 
comprometidos han dado lugar a distintos modelos teóricos sobre la percepción del 
habla. 


Preguntas de reflexión 

+ ¿En qué consiste un espectrograma y cuáles son sus tres dimensiones básicas? 

+  Enumera las principales propiedades generales de la percepción del habla. 

+ Desde el punto de vista teórico, ¿cuál es la cuestión central sobre los procesos de 
percepción del habla? 

+ ¿Qué son los formantes y qué papel cumplen en la percepción del habla? I Indica las 
principales teorías sobre la percepción del habla 1 ¿Cómo influye el contexto en la 
percepción del lenguaje? 
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RECONOCIMIENTO ORAL DE PALABRAS 


Objetivos de aprendizaje 
Al finalizar el capítulo el alumno será capaz de: 
e Reflexionar sobre la complejidad que supone la comprensión de palabras. 
e Entender los principios de organización del léxico mental. 
e Conocer las diferentes metodologías utilizadas en el reconocimiento de palabras. 
e Comprender cómo influyen diferentes características de las palabras en su 
reconocimiento. 
e Tener una visión crítica de los diferentes modelos de reconocimiento de palabras. 


INTRODUCCIÓN 

Sorprende la rapidez y precisión con las que reconocemos y comprendemos las palabras que 
escuchamos, máxime si se tiene en cuenta el enorme número de palabras que guardamos en la 
memoria para ser capaces de decidir en cuestión de milisegundos a cuál de ellas se refiere la 
secuencia de sonidos que llega a nuestros oídos. 

¿Cuántas palabras conoce una persona? No hay que perder de vista que cualquier hablante 
comprende muchas más palabras de las que emplea. Existen varias estimaciones al respecto; 
se calcula que una persona con una cultura media de bachillerato conoce, en su sentido más 
amplio, entre 40.000 y 80.000 palabras (Miller y Gildea, 1987). Este margen tan amplio 
depende de cómo se efectúe el cómputo: si se incluyen o no los nombres propios de personas o 
lugares, si «dormir», «duermes» o «durmió» cuentan como una o como varias, etc. Si un 
bachiller conoce 80.000 palabras y tiene 16-17 años, significa que a lo largo de su vida ha 
aprendido un promedio de 5.000 palabras anuales, es decir 13 diarias (Miller y Gildea, 1987). 
Normalmente la palabra se considera la unidad mínima de una lengua dotada de significado. 
Aunque en sentido estricto, es el morfema la unidad mínima con significado. Los morfemas 
pueden constituir palabras por sí mismos (p. ej., «cárcel») o ser apéndices de otras palabras (p. 
ej., la —s de «gatos», la a— de «anormal»). Los primeros son los morfemas libres, mientras 
que los segundos se conocen como morfemas ligados. Estos últimos modifican el significado 
del resto de la palabra y pueden ir delante (prefijos) o detrás (sufijos) de la raíz o lexema. 
Lexema es el morfema o parte de la palabra que tiene significado autónomo e independiente; 
por ejemplo, en la palabra «gatas» la raíz o lexema es «gat», mientras que el sufijo —a añade 
significación de género femenino y el sufijo -s de número plural. 

Gracias a los morfemas ligados se modifica el significado de los lexemas o se añaden 
flexiones. En ese sentido, cabe distinguir entre morfemas derivativos y morfemas flexivos 
(Recuadro 6-1). 
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Recuadro 6-1. Morfemas derivativos y morfemas flexivos 


Los morfemas derivativos pueden ser prefijos o sufijos, mientras que los flexivos son siempre 
sufijos. 

Los morfemas derivativos matizan o modifican el significado de las palabras a las que se 
añaden, en cambio los flexivos no modifican el significado, lo que hacen es establecer el 
género y el número, en el caso de los sustantivos y adjetivos o el modo, tiempo, número y 
persona en el caso de los verbos. 


Los primeros crean, por derivación, nuevas palabras, ya que modifican sensiblemente al 
lexema y cambian por completo su significado dando origen a otra palabra distinta. Así, el 
prefijo descambia «cansar» por «descansar», «acuerdo» por «desacuerdo», que tienen 
significados contrarios. Aquí los lingiiistas hablan de palabras primitivas, que sirven de base 
(«árbol», «cuchara», «vivir»), y palabras derivadas («arboleda», «cucharada», «convivir»), 
que se han originado a partir de las primitivas. Los morfemas flexivos, por el contrario, no 
alteran el significado de la raíz o lexema. Permiten la flexión de las palabras al codificar el 
número, el género o el tiempo verbal. Así, «gato», «gatos», «gata», «gatas» no son palabras 
completamente diferentes con significados distintos; tampoco lo son «comió» y «comías». 
Al evocar una palabra en nuestra mente, activamos un amplio conjunto de información. Por 
supuesto, activamos su significado, aunque éste puede variar notablemente en cuanto a su 
precisión. Así, es muy posible que se conozca mejor el significado de la palabra «tuerto» que 
el de la palabra «cigieñal». Se puede saber que esta última designa a una pieza del motor de un 
vehículo, pero no estar seguro de su función y probablemente no identificarla entre otras pie- 
zas del motor. 
Además del significado, al evocar una palabra activamos información fonológica o el conjunto 
de sonidos que componen dicha palabra. También activamos información ortográfica, desde el 
momento en que sabemos escribirla; es decir, dibujar los grafemas o letras que la representan 
en el lenguaje escrito. Por otra parte, sabemos que «perro» es un nombre masculino singular, 
«blando» es un adjetivo, «dormir» es un verbo, etc. Asimismo, sabemos qué funciones puede 
desempeñar cada palabra dentro de la oración. Estas dos clases de información, morfológica y 
sintáctica, corresponden a un conocimiento implícito que uno tiene como hablante de una 
lengua, con independencia de que se haya estudiado o no en la escuela. Si se tienen 
conocimientos de gramática podrá hacerse explícito y ser capaz de nombrar que esto es del 
género masculino y aquello del número plural; pero, aunque jamás se haya pisado un colegio, 
se dispone de esa información morfosintáctica de modo implícito y puede manejarse 
apropiadamente todos los días, a todas horas, al hablar y oír lenguaje. 
Cuando hablamos u oímos lenguaje de forma comprensiva -que es lo habitual-, debemos 
activar palabras en nuestro cerebro, a razón de dos o tres veces por segundo. ¿Cómo lo 
hacemos? Cualquiera que sea el mecanismo de activación, es evidente que éste deber ser: 

+ Rápido, pues, como se ha mencionado, generalmente ocurre en menos de un segundo. 

» Muy eficiente, puesto que se trata de activar una unidad léxica entre decenas de miles 

posibles. 
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La activación de palabras en nuestra mente se produce no sólo en el uso del lenguaje hablado, 
sino también en el escrito, al leer y escribir. Las principales diferencias se derivarían de la 
naturaleza física del estímulo y sus consecuencias perceptivas, pero nada hace pensar que los 
procesos centrales de comprensión sean sustancialmente diferentes en ambas modalidades. La 
distinción más importante es que la señal del habla se distribuye en el tiempo y es evanescente, 
mientras que en la escritura se distribuye en el espacio y es permanente. Además, como se ha 
señalado al tratar la percepción del habla, el lenguaje oral es mucho más variable que el escrito 
y no presenta límites claros entre sus componentes. 

Antes de considerar los procesos mentales que operan en el procesamiento de las palabras, es 
necesario conocer algunos principios generales relacionados con la estructura del léxico de las 
lenguas. 


ESTRUCTURA Y ORGANIZACIÓN DEL LÉXICO 
Todas las lenguas del mundo disponen de vocabularios formados por miles de palabras. La 
edición 23* del DRAE recoge 93.111 lemas o entradas, y se sirvió del Banco de Datos del 
Español, que cuenta con más de 270 millones de registros acumulados a través de los años. 
Otro tanto podría decirse del inglés y otras lenguas. 
A pesar de la diversidad, los vocabularios de las distintas lenguas se ajustan a unos principios 
generales que se describen a continuación. 

+ Dos vocabularios básicos 
Es posible distinguir entre dos clases de palabras muy diferentes que, según indican los datos, 
se procesan de forma distinta en el cerebro humano. Desde el punto de vista lingúístico (Fig. 
6-1), corresponden a las denominadas categorías mayores o de clase abierta (nombres, 
verbos, adjetivos y algunos adverbios) y a las categorías menores o de clase cerrada (artículos, 
preposiciones, conjunciones, auxiliares, etc.). 


Clase abierta 


Clase cerrada 


cabeza coche esperanza beber mal 


azul blando comer libro dulce 
rápidamente Mesa camino ágil Mar 


clavo ritlante Marilyn 


amable foto Monta uña 


silla manzana sol Palabras de función 


alto 


Palabras de contenido Pocas 


Muy frecuentes 
Decenas de miles y 


Figura 6-1. En cualquier lengua existen dos tipos de vocabularios con características distintas: palabras de clase 
abierta, o de contenido, y palabras de clase cerrada, o de función. 


Las palabras de clase abierta, o palabras de contenido, poseen significado pleno y son, con 
diferencia, el grupo mayoritario, formado por decenas de miles de vocablos. Se denominan de 
clase abierta porque constituyen un conjunto que no cesa de incorporar nuevos términos a lo 
largo del tiempo. Son palabras que surgen y se usan en la calle y que luego, normativamente, 
pasan a formar parte del idioma. En el español, es la Real Academia Española quien se encarga 
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de esa tarea a través del DRAE, cuyas sucesivas ediciones suman miles de nuevos vocablos, 
todos ellos de clase abierta. En el uso diario del lenguaje con frecuencia creamos nuevos térmi- 
nos: «he visto un jersey amarillo pistacho que me ha encantado», si al día siguiente decimos 
«he visto un jersey apistachado que me ha encantado» y se extiende su uso, podríamos haber 
creado un nuevo adjetivo para una tonalidad de color. Esto es lo que sucede con los nombres, 
verbos y adjetivos calificativos. También el avance tecnológico obliga a crear o aceptar nuevas 
palabras para nuevos objetos (p. ej., «spray» está aceptado en el DRAE). 

Pero ¿cuántos siglos han de pasar para que un idioma incorpore un nuevo artículo, una nueva 
preposición o una conjunción? Se trata de un club selecto al que sólo pertenecen unos pocos 
miembros, dos o tres centenares de palabras, a lo sumo. La clase cerrada, o palabras de función 
(también denominadas functores), se componen de elementos sin contenido semántico pleno, 
que sirven para modificar el significado de las otras palabras y establecer relaciones entre 
ellas. No es lo mismo «ir a Valencia» que «ir desde Valencia», «estar en la caja» que «estar 
sobre la caja», etc. Para Aitchison (1992), las palabras de función son el cemento del lenguaje 
que mantiene unidos a los ladrillos formados por las palabras de contenido. Desempeñan un 
papel clave en la construcción de la estructura sintáctica y transmiten información esencial 
para la asignación de funciones dentro de la oración. Compárese, por ejemplo, «el hombre que 
insultó a Juan» y «el hombre al que insultó Juan»; los papeles de sujeto y objeto cambian 
completamente a causa de las palabras de función. 

Por otra parte, estas «palabras» —algunos lingitistas les niegan este estatus- son pocas pero de 
uso muy frecuente en el idioma. Los recuentos del inglés escrito indican que la palabra más 
usada es 'the' (el, la los, las), a la que siguen 'of' (de), 'and' (y) y otras palabras de función 
(Miller, 1984). En castellano, como se verá más adelante, la palabra más frecuente es «de», se- 
gún la base LEXESP, y le siguen «la», «que», «y», «el», «en», etc., todas también de función. 
Por la misma razón, estas palabras son bastante más cortas que las de contenido. Cuesta 
imaginar un idioma en el que, póngase por caso, la conjunción «y» tuviera tres O cuatro 
sílabas. 

Hay evidencias de que la representación y el procesamiento de ambos tipos de vocabulario 
presentan importantes diferencias. Entre ellas destacan las que se describen seguidamente. 
Lesiones cerebrales. Una lesión puede afectar selectivamente más a un tipo de vocabulario 
que al otro. En la afasia de Broca hay mayor dificultad para el uso de las palabras de función 
que de las de contenido. En esta afección, el lenguaje telegráfico y los problemas de manejo y 
compresión de las estructuras sintácticas (agramatismo) están asociados, sobre todo, a 
dificultades con las palabras funcionales. Estas, sin embargo, se hallan relativamente preserva- 
das en la afasia de Wernicke, cuyos pacientes no entienden ni producen las palabras de 
contenido. La «jerga» incomprensible que generan los afásicos de Wernicke, y sus graves 
dificultades para comprender el lenguaje, se derivan principalmente del deterioro en el 
procesamiento de palabras de contenido. 

Adquisición del lenguaje. En el desarrollo de la primera lengua se observan notables 
diferencias entre ambos tipos de palabras. Se sabe que la aparición del vocabulario de clase 
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cerrada es mucho más tardía que la del vocabulario de clase abierta. Las primeras palabras 
infantiles son fundamentalmente de clase abierta (o de contenido). Más adelante, los niños 
atraviesan una etapa en la que omiten morfemas y palabras funcionales como las 
preposiciones, conjunciones, etc., dando lugar a lo que se conoce como «lenguaje 
telegráfico). 
Resultados experimentales y observacionales. Experimentos con adultos sanos arrojan 
resultados distintos con unas y otras palabras. Como se verá más adelante, la frecuencia de uso 
es una variable que tiene un poderoso efecto en la identificación de las palabras, pero esto 
sucede sólo con las de contenido; parece que las palabras de función no se ven afectadas por la 
frecuencia léxica en la misma medida (Bradley y Garrett, 1980). Hay trabajos que ponen de 
manifiesto una mayor «invisibilidad» de las palabras de función, en tareas que consisten en 
identificar rápidamente una letra particular sobre un texto. La probabilidad de omisión es 
mucho mayor cuando la letra forma parte de una palabra de función que de contenido 
(Drenowski y Healy, 1977). 

+ Organización del léxico mental 
Como resumen Belinchón et al. (1992), comprender una palabra implica comparar y acoplar 
un estímulo externo (escrito o hablado) con estructuras de información previamente 
representadas en la memoria del oyente. Aparentemente, el proceso de comprensión sucede de 
manera inmediata e instantánea. ¿Cuánto tiempo transcurre desde que escuchamos la palabra 
«mosca» y evocamos mentalmente el insecto? Parece que la comprensión es un estado mental 
que brota de forma repentina en nuestra conciencia, sin ningún paso intermedio. Sin embargo, 
hoy sabemos que esta «atemporalidad» es sólo aparente; la compresión es, en realidad, la 
culminación de un conjunto complejo de subprocesos que ocurren de forma rápida y au- 
tomatizada, y de los cuales no somos conscientes, ni podemos observarlos introspectivamente. 
Sólo somos conscientes del resultado final. 
Si comprender significa, en última instancia, emparejar información externa del estímulo con 
estructuras de información prealmacenada en nuestra memoria, la pregunta surge de in- 
mediato: ¿cómo y dónde guardamos en nuestra cabeza toda la información de que disponemos 
sobre miles de palabras de nuestro idioma? ¿Cómo está organizado nuestro hipotético «léxico 
mental» en el cerebro? 
Tradicionalmente se había propuesto el concepto de diccionario o léxico mental, como la hi- 
potética estructura donde se representaría esta información de manera organizada. El primer 
autor que desarrolló esta idea fue R. C. Oldfield en un artículo publicado en 1966 con el título 
Cosas, palabras y el cerebro (Oldfield, 1966). En principio, hablar en abstracto de un léxico 
mental no presupone necesariamente que éste tenga una realización neural particular frente a 
otra (podría estar confinado a una localización concreta de la corteza, podría abarcar amplias 
zonas difusas o cualquier otra solución que pudiera imaginar el lector). Es una construcción 
teórica útil, porque es fuente de hipótesis que se pueden verificar empíricamente con 
experimentos psicolingúísticos. Su materialización neural la irá desvelando el avance de la 
neuropsicología (estudio de las lesiones y sus efectos) y de las neurociencias. 
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Los diccionarios escritos están ordenados por orden alfabético. Lógicamente, el léxico mental 
deberá estar organizado de acuerdo con otros principios, que ya se analizarán al tratar los 
modelos teóricos. Al igual que un diccionario tiene entradas que corresponden a las distintas 
palabras incluidas, el léxico mental constaría de una lista o red de «entradas léxicas», cada una 
de la cuales incorporaría, al menos, la siguiente información (Belinchón et al., 1992): 

+ Una representación fonológica, acerca de los sonidos que constituyen la palabra, cómo 
se pronuncia. 

+ Una representación ortográfica, es decir, el conjunto de letras que forman la palabra, 
cómo se escribe. 

+ Una representación morfológica, que refleja su estructura y categoría gramatical 
(sustantivo, verbo, adjetivo, etc.). Hay rasgos formales que constituyen indicios sobre la 
clase gramatical de la palabra: los sufijos -oso, -ble, etc., identifican adjetivos; los 
sufijos -r, -ndo, -mos, -ais, etc., señalan verbos; los sufijos -ion, -dad, etc., indican 
nombres. 

+ Unarepresentación sintáctica, que indica las funciones que puede representar la palabra, 
qué lugares podría ocupar dentro del andamiaje sintáctico (sujeto, objeto directo, objeto 
indirecto, etc.). 

+ Unarepresentación semántica sobre su significado. Esta cuestión se abordará en detalle 
más adelante. 

+  Terminas, o conceptos asociados a la entrada léxica por sus significados. 

Es evidente que no todas las entradas de ese diccionario mental estarían completas. Por 
ejemplo, si una persona es analfabeta o no sabe cómo se escribe una palabra, no dispondría de 
su representación ortográfica. La representación semántica, por otro lado, puede variar 
notablemente de unas palabras a otras, en cuanto a la precisión y el nivel de detalle de los 
significados. A veces, en el uso diario del lenguaje puede fallar la conexión entre algunas de 
esas representaciones, de manera que no se activen todas como sería deseable: por ejemplo, en 
el fenómeno de la «punta de la lengua» no somos capaces de activar la información fonológica 
y ortográfica de la palabra, pero sí la semántica (podemos detallar aspectos de su significado, 
para qué sirve el objeto designado por la palabra, etc.) e incluso morfosintáctica (si es género 
masculino o femenino). Este es un fenómeno normal que ocurre de forma esporádica; sin 
embargo, algunas lesiones cerebrales pueden dar lugar a un cuadro de anomia, en el que el 
enfermo tiene gran dificultad para recordar el nombre de las palabras, incluso de las más 
comunes (Cuetos, 2003). 

¿Listado exhaustivo o listado parcial? En ese hipotético diccionario o léxico mental, 
palabras como «comer», «comió» y «comedor» ¿tienen una entrada léxica cada una, o sólo 
existe una única entrada a partir de la cual se derivan todas las variantes morfológicas? Dicho 
de otro modo, ¿cómo se representan en el léxico mental las variantes morfológicas de las 
palabras? Esta es, como tantas en la psicolingúística, una cuestión abierta aún, sin una 
respuesta única. Existen al respecto dos hipótesis alternativas. Una es la hipótesis denominada 
del listado exhaustivo, que considera que cada variante tiene su entrada o representación 
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propia. La otra es la hipótesis del listado parcial o segmentación obligatoria, que defiende que 
el léxico sólo contiene una lista parcial de entradas léxicas que incluye, por un lado las raíces o 
«formas base», y por otro los afijos (prefijos y sufijos). Según esta hipótesis, para identificar 
una palabra morfológicamente compleja, primero debemos «despojarla» de todos sus afijos y 
luego localizar su forma base (Taft y Forster, 1975). Bastantes datos empíricos parecen apoyar 
esta segunda hipótesis, por ejemplo, el hecho de que los tiempos de reacción de palabras 
seudoprefijadas como «interés» o «resultado» que realmente no tienen prefijos pero tienen 
apariencia de tenerlos (in- y re-, respectivamente), se procesan más lentamente que las 
palabras control (Taft, 1981). Asimismo, las seudopalabras compuestas por morfemas reales, 
como, por ejemplo, «floristero» o «panaderista» tienen tiempos de reacción mayores porque 
cuesta más decidir que no son palabras reales. 

Pero lo que realmente apoyan los datos empíricos de forma clara es una síntesis de las dos 
hipótesis anteriores, la hipótesis mixta o dual (Caramazza, Laudanna y Romani, 1988). De 
acuerdo con esta hipótesis, por una parte existe un listado exhaustivo para las palabras 
irregulares, para las monomorfémicas y para las muy familiares aunque sean regulares, ya que 
por su gran uso puede resultar más operativo mantener representaciones independientes de 
todas sus formas, y, por otra parte, estarían las palabras morfológicamente complejas y 
regulares de manera segmentada, ya que por un lado se encontrarían las raíces y por otro lado 
los afijos. Ambas partes se procesan por separado y posteriormente se unen. Este 
procedimiento es especialmente útil con las palabras de baja frecuencia, pues no es necesario 
conocer todas las formas derivadas para entender y utilizar una forma concreta (no es 
necesario disponer de todas las formas del verbo «bracear» para entender la palabra 
«braceábamos»). 

En realidad, la noción de morfema es complicada y, desde el punto de vista psicológico, puede 
responder a realidades distintas. Parece que un factor que influye en la descomposición de las 
palabras es el grado de transparencia que éstas tienen para nosotros (Marslen-Wilson et al., 
1994). Si una palabra compuesta no es transparente respecto a sus componentes se 
representará como otra palabra aparte; por ejemplo, «camaleón» no es transparente respecto a 
sus componentes «cama» y «león» y se almacena independientemente de estas últimas. 
Paralelamente, una distinción que se ha revelado útil es aquella que discierne entre una 
morfología de nivel l, en la que se produce una alteración de la raíz (de «soñar», «sueño»; de 
«toro», «taurino»), y una morfología de nivel II, donde no se altera la raíz (de «comer», «Co- 
medor»; de «misa», «misal») (Emmorey y Fromkin, 1988). Probablemente, las 
transformaciones de nivel I darían lugar a unidades nuevas en el léxico mental, mientras que 
las de nivel II tenderían a depender de una única entrada léxica. 

Acceso léxico. ¿Cuál es la primera representación del estímulo que nos permite acceder al 
léxico mental y activar toda la información de una palabra? Es como preguntarse por la «llave» 
que abre la puerta de cada entrada léxica, y en psicolingúística se conoce como la cuestión del 
código de acceso al diccionario mental. Un gran volumen de investigación ha sugerido 
diversas unidades funcionales como aspirantes a desempeñar este papel de clave o código de 
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acceso. Además, estas unidades podrían ser distintas dependiendo de las propiedades de cada 
palabra; por ejemplo, una palabra muy frecuente podría reconocerse como un todo, sin 
necesidad de llevar a cabo un análisis de sus partes, mientras que otra menos común podría 
requerir un análisis de sus componentes, bien en el plano visual (letras o grupos de letras), bien 
en el plano fonológico (fonemas, sílabas y otras unidades). Muchos autores entienden que en 
la operación de acceder al léxico mental desempeña un papel especial la primera porción de la 
palabra, como se verá al tratar los modelos teóricos. Otros autores, generalmente 
conexionistas, consideran innecesario plantear un mecanismo de acceso separado del 
mecanismo de activación léxica. Altman (1997, pp. 70-71) escribe al respecto: 
Una forma de pensar sobre esto [el acceso léxico] es recordar que, en último término, 
toda la información del léxico mental está almacenada dentro de estructuras neurales 
del cerebro. Cuando un patrón de luz entra en los ojos, o una secuencia de sonidos 
entra en los oídos, tales estímulos no acceden a algo dentro del cerebro, aunque sea, 
por ejemplo, la identificación de un político hablando o de un bebé balbuceando (o 
ambos, si son indistinguibles). En su lugar, la estimulación pasa a través de circuitos 
neurales del cerebro, siendo modificada y, a su vez, estimulando (o activando) 
diferentes partes del circuito. Sólo ciertas clases de estímulos proporcionarán la 
estimulación apropiada para algunas partes específicas del circuito neural -el estímulo 
es una llave que puede activar una parte del circuito, y dependiendo de qué parte es 8 
activada, nosotros experimentamos la vivencia de «ver un político» u «oír un bebé» [...] 
El punto importante de esto es que nada es accedido; es activado. 
En el reconocimiento de las palabras habladas, la mayor parte de los enfoques teóricos sobre el 
acceso léxico comparten la idea de que intervienen dos tipos de mecanismos fundamentales: 
activación y competición. Pese a la diversidad de modelos y aproximaciones teóricas 
(TRACE, Shortbst, PARSYN, DCM, etc.), hay consenso en aceptar que el input, o 
información de entrada, activa un conjunto de candidatos posibles que compiten entre sí en el 
proceso de identificación léxica. 


METODOLOGÍAS EXPERIMENTALES 

Los psicólogos del lenguaje tienen a su disposición un conjunto de técnicas experimentales 
para explorar los procesos de acceso léxico o reconocimiento de palabras. A ellas hay que 
añadir las técnicas de neuroimagen sobre la activación cerebral, que se han mencionado en el 
capítulo 3. Ninguna técnica es perfecta y cada una tiene sus ventajas e inconvenientes. 

+ Técnica gating (apertura sucesiva) 

Su versión actual se debe a Francois Grosjean, profesor de la Universidad de Neuchátel en 
Suiza (Grosjean, 1980), pero con anterioridad se habían empleado versiones más simples. En 
esta tarea, un estímulo lingúístico -habitualmente, una palabra monosílaba- se va presentando 
a través de sucesivos segmentos de duración creciente, hasta que puede ser identificado. 
Habitualmente los segmentos se inician desde el principio del estímulo. El primer segmento 
normalmente es muy corto (20-30 ms), y el último abarca ya el estímulo entero. Hay variantes 
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de la tarea que difieren según el tamaño del incremento, la dirección de presentación (de 
adelante atrás, o de atrás adelante), el tipo de respuesta, etc. (Grosjean y Frauenfelder, 1996). 
La variable dependiente (VD) es la duración mínima del estímulo que permite su 
identificación. 

» Detección de estímulos (monitoring) 
Empleada por primera vez por Foss (1969), en este caso la tarea del participante consiste en 
responder rápidamente, pulsando un botón, cada vez que aparece un estímulo determinado 
(fonema, sílaba, palabra, etc.) establecido previamente en las instrucciones, al mismo tiempo 
que procesa cierto material lingúístico, palabras, oraciones, discursos, etc. El tiempo de 
reacción para la detección del estímulo se considera un reflejo de la carga de trabajo que tiene 
el sistema cognitivo en ese momento, mientras procesa el material lingiiístico. Así, si el 
fonema que se debe detectar forma parte de una palabra de difícil procesamiento, su detección 
tardará más milisegundos que si el fonema está en una palabra de procesamiento fácil, o si 
tiene que detectar una palabra los tiempos, serán mayores cuando forma parte de una oración 
compleja. La tarea también implica una decisión. 

+ Decisión léxica 
Se trata de una de las tareas más usadas en la psicolingúística, tanto en la modalidad auditiva 
como en la visual. En la modalidad visual fue empleada por primera vez en 1970 por 
Rubenstein y sus colegas (Rubenstein, Garfield y Millikan, 1970), y en la modalidad auditiva, 
por McCusker, Holley-Wilcox y Hillinger (1979). En la tarea visual, el participante debe 
decidir rápidamente si un estímulo formado por un conjunto de letras es una palabra de su 
idioma o no lo es. En la modalidad auditiva, el participante debe decidir si los sonidos que 
escucha, normalmente a través de unos auriculares, forman una palabra o no. El participante 
tiene que emitir su respuesta pulsando un botón o una tecla del ordenador, entre dos posibles: 
el botón del «sí» (palabra) y el botón del «no» (no-palabra). La VD es el tiempo de reacción, 
generalmente analizado sólo en las palabras, es decir, los milisegundos que transcurren entre la 
presentación del estímulo y la respuesta del sujeto. Unos 500-700 ms son tiempos habitúales, 
dependiendo de cada palabra. Otra VD que también se tiene en cuenta es la proporción de 
errores. 
Se entiende que aquí el participante accede y busca velozmente en su «diccionario» mental y, 
si encuentra una unidad léxica, responde con la tecla «sí». Si busca y «agota» el diccionario sin 
encontrar una unidad léxica, termina respondiendo «no»; esto generalmente consume más 
tiempo. La tarea tiene ventajas sobre la anterior, pero tampoco elimina completamente la posi- 
bilidad de procesos posléxicos, porque introduce un subproceso ajeno al acceso léxico que es 
la propia «toma de decisión», que también consume tiempo. 

* Otros métodos 
La lista de métodos no se agota con los anteriores, ya que el psicolingiiista puede emplear otros 
procedimientos o técnicas, algunas derivadas de las anteriores. En los estudios sobre el 
significado de las palabras se emplean tareas de decisión o categorización semántica, donde el 
participante debe tomar una decisión rápida, pulsando un botón, en respuesta a procesos de 
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carácter semántico. Por ejemplo: ¿la palabra «naranja» es una fruta o una verdura? ¿es más 
grande un «gorrión» que un «gato»? 

También hay tareas de categorización sintáctica, como la decisión de género y otras: ¿la 
palabra «cárcel» es masculina o femenina? ¿«Papel» es masculino o femenino? Un 
procedimiento como éste permite en castellano el estudio de procesos genuinamente 
gramaticales (morfosintácticos), porque en nuestro idioma el género de muchos sustantivos no 
tiene conexión con ninguna propiedad semántica (atributos sexuales) del referente: la palabra 
«mesa» designa un objeto que no tiene propiedades de hembra en sí mismo; la palabra «libro» 
designa un objeto que no posee atributos masculinos; se trata de información inequívocamente 
lingúística. 

A partir de Cutler y Norris (1988), se ha introducido la tarea de localización de palabras 
(wordspotting), sobre todo en investigaciones sobre la influencia de la estructura prosódica del 
lenguaje (entonación y ritmo) en el reconocimiento léxico. Aquí se administra auditivamente 
una lista de no-palabras, o palabras sin sentido, algunas de las cuales incluyen en su interior 
una palabra que el participante debe detectar lo más rápidamente posible (p. ej., «sal» en 
«salpe»). Los sujetos experimentales no saben de antemano cuáles son las palabras; las 
instrucciones indican que se debe identificar cualquier palabra real que aparezca. Este método 
tiene cierta validez ecológica, en el sentido de que intenta emular el proceso natural de 
reconocer palabras dentro de una corriente continua de habla (Grosjean y Frauenfelder, 1996). 1 0 
En ocasiones los experimentos sobre el reconocimiento de palabras son difíciles de interpretar 
porque los datos no confluyen en un cuadro coherente. No hay ninguna tarea «pura» que 
refleje únicamente el subproceso que se pretende estudiar. Todas las tareas incorporan 
inevitablemente otros procesos añadidos que pueden «contaminar» los resultados, añadir 
«ruido» a la información buscada. La tarea de decisión léxica incluye un proceso de toma de 
decisión que consume tiempo por sí mismo y es ajeno al propio acceso léxico. Y, lo que es 
peor, las tareas pueden interactuar con aquello que se estudia; si los efectos no deseados fueran 
fijos e inmutables a través de las condiciones, bastaría con descontarlos, pero no tiene por qué 
ser así. En palabras de Harley (2009), es como si se usara un telescopio para juzgar el color de 
las estrellas y el color de sus lentes cambiara dependiendo de la distancia a la que se hallaran 
esas estrellas. Eso hace que el avance sea difícil, pero la empresa merece la pena. Por esta 
razón, Cada vez que se obtiene un hallazgo particular en el reconocimiento de las palabras, o en 
cualquier otro campo de la psicolingiiística, se concede gran importancia a la replicación de los 
resultados a través de tareas distintas. 


VARIABLES QUE INFLUYEN EN EL RECONOCIMIENTO DE LAS PALABRAS 
La aplicación de los métodos descritos ha proporcionado un conjunto de hallazgos empíricos 
que pasamos a detallar. Lógicamente, cualquier modelo teórico que aspire a ser una 
explicación coherente de los mecanismos de acceso léxico, debe ser capaz de dar cuenta de 
ellos. 
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+ Punto de unicidad 
Uno de los efectos más determinantes del conocimiento oral de palabras es el del punto de 
unicidad, esto es, el punto de la palabra en el que se convierte en única del idioma, ya que no 
hay ninguna otra que comience por esos mismos fonemas. Puesto que en el lenguaje oral hay 
una secuenciación temporal en el sentido de que los fonemas que forman una palabra van 
llegando al oído del oyente uno tras otro, los primeros sonidos que llegan son los iniciales de la 
palabra. Cuando el oyente percibe el primer fonema, se activan en su léxico todas las palabras 
que comienzan por ese fonema; por ejemplo, al oír el fonema /e/ se activarán palabras como 
«escuela», «encina», estorbo», «edad», etc. Cuando llega el segundo fonema, por ejemplo /1/ 
muchas de estas palabras se desactivarán y permanecerán sólo las pocas que comienzan por 
/el/, como «elástico», «elíptico», «elocuente», etc. Al llegar el tercer fonema, por ejemplo /e/, 
el número de palabras activas se reduce a unas pocas «eléctrico», «elegante», «elevado», etc. 
Y cuando llega el cuarto fonema /f/, ya sólo queda activada la palabra «elefante», con lo cual 
ya se puede reconocer la palabra, incluso sin haber terminado de escucharla. Por el contrario, 
con las palabras que tienen el punto de unicidad al final, hay que esperar a oír todos los 
fonemas para poder reconocerlas. Se trata, por lo tanto, de una variable determinante de los 
tiempos de reconocimiento de las palabras habladas: cuanto más al comienzo se encuentra el 
punto de unicidad, antes se reconoce la palabra. 

+. Frecuencia léxica 
Es uno de los efectos más robustos de la psicolingúística; se replica en cualquier laboratorio 
del mundo con lenguas distintas y en condiciones muy diversas. Consiste en que las palabras 
usadas con más frecuencia en un idioma se identifican más fácilmente y con mayor rapidez 
que las empleadas con menos frecuencia. Así, se procesa más velozmente la palabra «amistad» 
que la palabra «arrabal», porque a lo largo de nuestra vida nos hemos enfrentado muchas más 
veces a la primera que a la segunda. Por emplear una metáfora física: en los senderos más 
transitados de un monte crece poca maleza y el paso a través de ellos es muy fluido, es decir, 
seguirán siendo los más transitados; no conocemos en detalle los mecanismos neurales del 
acceso léxico, pero es como si los «senderos neuroeléctricos» más utilizados permitieran un 
tránsito más fluido del impulso nervioso. 
Debido al papel tan importante de la frecuencia léxica en el reconocimiento de palabras se han 
elaborado diccionarios de frecuencia en la mayoría de los idiomas para poder cuantificar de 
manera fiable esta variable. Estos diccionarios se construyen haciendo recuentos a partir de un 
corpus o un conjunto amplio de muestras naturales de lenguaje, generalmente escrito, 
extraídas de ámbitos muy variados (literatura, revistas, periódicos, ensayos, etc.). Los datos 
obtenidos en muchos idiomas arrojan un mismo patrón general: unas pocas palabras, sobre 
todo las de función, se usan muchísimo, mientras que otras se emplean en pocas ocasiones; 
entre ambos extremos se distribuye todo el conjunto. Algunos estudios comparativos 
encuentran ciertas diferencias entre el lenguaje oral y escrito, pero en lo sustancial esta pauta 
se mantiene. 
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Durante bastantes años se empleó como referencia en castellano el Diccionario de frecuencias 
de Juilland y Chang-Rodríguez (1964), construido a partir de un corpus de medio millón de 
palabras, utilizando la tecnología del momento basada en las tarjetas perforadas. Pese a su 
antigiedad y el reducido tamaño de la muestra, contaba con la virtud de un tratamiento 
individualizado de cada vocablo, diferenciando entre homógrafos o palabras distintas que se 
escriben igual, por ejemplo, «que» pronombre y «que» conjunción, «haya», nombre de árbol y 
«haya», del verbo haber. Esto no es posible si el recuento se reduce a un simple escaneo de 
textos. Hoy contamos con trabajos más recientes y voluminosos, como el Diccionario de 
frecuencias de Alameda y Cuetos (1995), elaborado en la Universidad de Oviedo, y que abarca 
2 millones de palabras, o el LEXESP (léxico informatizado del español) (Sebastián-Galles, et 
al., 2000), integrado por un corpus de cinco millones. 

El corpus LEXESP incluye un conjunto de exactamente 5.020.930 unidades léxicas escritas, y 
en su construcción participaron autores de varias universidades españolas. Se extrajeron de 
modo informatizado desde seis dominios lingúísticos: narrativa (329 obras), divulgación 
científica (2 revistas), ensayo (88 obras), prensa (7 diarios), semanarios (4) y prensa deportiva 
(3). Todos los textos seleccionados son relativamente actuales, desde 1978 hasta 1995. Ofrece 
no sólo la frecuencia absoluta y relativa dentro del corpus, sino también otros índices útiles en 
la investigación psicolingúística, como familiaridad, concreción, imaginabilidad, etcétera. 
Comparemos dos listados extraídos del LEXESP: uno formado por las 20 palabras más usadas 
en el castellano escrito, y otro constituido por 20 palabras de frecuencia inferior (Tabla 6-1). 


blo Us DóS dOltos de pálbeas: Las diferencias son claras: las palabras más frecuentes son muy 
Datos del LEXESP sob total 5 > s 
o paso cortas y casi todas son palabras de función, mientras que las 


Palabra. Frecuencia — Palabra Frecuencia Otras son palabras de contenido y de mayor longitud. Las 6 

Es ias SH palabras más frecuentes («de», «la», «que», «y», «el», «en») 
explican por sí solas el 20% de las palabras usadas en el 

que 30.511 entendido 26 

y 27.975 explosión 26 lenguaje escrito. 

el 27.807 — frecuentes 26 La distribución de las palabras ordenadas por sus frecuencias 

2 Eine ent e es muy asimétrica y jerarquizada. Si se tratara de posesión de 

tierra, unos pocos terratenientes acumularían casi toda la tierra 


la 38.341 encontraban 26 


a 18.190 hermanas 26 


los 16.627 intelectuales 26 


a PARA a en enormes latifundios, mientras que, en el otro extremo, una 
un 12393 — llegaban 26 gran masa de pequeños propietarios tendría minúsculos 
no 11.055 "monjas 26 minifundios, y, entre ambos, todas las posibilidades 
y al PES %% intermedias. En esta distribución, los decrementos entre 
del 9.785 occidente 26 
frecuencias consecutivas, empezando por la mayor, van 
una 9.556 sacado 26 
con 9.396 — seguían 26 disminuyendo a medida que se avanza en ella. Así, el escalón 
por 7.978 sienten 26 entre la primera y la segunda frecuencia baja 14.392 unidades, 
id Po SAS 2 entre la segunda y tercera baja 7.830, etc. Existen 
es 6.738 sospecha 26 . . A A 
> A SE o irregularidades, pero estas diferencias se van acortando hasta 
O, Sucedió s) 
E 5sor ida 26 que finalmente se encuentran muchas palabras que comparten 
Tomado de Sebastián-Galé tal, 2000 la misma frecuencia; por eso, las unidades del segundo listado 
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tienen todas 26 ocurrencias por millón. Estas propiedades generales se constatan en todas las 
lenguas. 

Un problema que existe con estos diccionarios es que se han construido sobre muéstreos de 
textos escritos y, obviamente, el lenguaje oral y el escrito no son del todo equivalentes, por lo 
que podría ocurrir que estas medidas de frecuencia fuesen apropiadas para tareas de lectura 
pero no tanto para el lenguaje oral. La ausencia de diccionarios de frecuencia del lenguaje oral 
se debe a que es mucho más costoso obtener un corpus del habla que de los textos escritos. Sin 
embargo, en los últimos años se han construido diccionarios a partir de los subtítulos de las 
películas y series televisivas, ya que son fáciles de obtener de Internet y reflejan el lenguaje 
oral de las películas. A través de los subtítulos se han elaborado diccionarios de frecuencia oral 
en multitud de idiomas, incluidos inglés, francés, chino, etc., y también en español (Cuetos et 
al., 2011) sobre un corpus de 45 millones de palabras. 

Uno de los primeros trabajos que pusieron al descubierto los efectos cognitivos de la 
frecuencia léxica fue el de Foss (1969), con la técnica de detección de fonemas. Los 
participantes debían escuchar un estímulo de habla continua y realizar dos tareas a la vez: a) 
entender el mensaje contenido en él, y b) pulsar un botón cada vez que apareciera el fonema /b/ 
en el estímulo. Este fonema podía aparecer inmediatamente después de una palabra frecuente 
o de una palabra poco frecuente del inglés. Foss encontró que las latencias para detectar el 
fonema eran claramente más cortas después de una palabra frecuente, presumiblemente 
porque exigía menor carga de procesamiento que una palabra poco frecuente. 

En realidad, la verdadera variable psicológica es la familiaridad subjetiva que las personas 
tienen con cada palabra, la cual está determinada por la historia biográfica particular de cada 
uno, y no tanto por las veces que una palabra aparece contabilizada en un diccionario de 
frecuencias sobre un idioma. La medida de familiaridad se obtiene en estudios normativos, en 
los que las personas otorgan puntuaciones a un conjunto de palabras sobre una escala de 
familiaridad. Los resultados demuestran, sin embargo, que estas puntuaciones subjetivas 
guardan una estrecha relación con los índices objetivos obtenidos en los recuentos estadísticos, 
y el coeficiente de correlación es alto: r > 0,80 (Gernsbacher, 1984). Por esta razón y por 
motivos prácticos, en los experimentos suelen emplearse los índices objetivos de los 
diccionarios de frecuencias. 

Se ha discutido -y se discute- mucho sobre el verdadero «locus» del efecto de la frecuencia en 
el procesamiento léxico; en otras palabras, en qué subproceso específico incide este efecto. 
Balota y Chumbley (1984) han sido críticos con las interpretaciones convencionales y 
rechazan que sea un efecto genuino de acceso léxico. Su planteamiento es el siguiente: si la 
frecuencia es una variable que influye directamente en el acceso léxico, entonces su efecto 
debe ser patente en cualquier tarea que implique acceso léxico, pero no siempre ocurre así. 
Estos autores no hallaron efecto de la frecuencia en una tarea de categorización semántica, en 
la que los participantes debían decidir rápidamente si una entidad determinada pertenecía a 
una categoría semántica previamente fijada (p. ej., ante la categoría prefijada «ave» emitir una 
decisión rápida sobre estímulos como «gallina», «león», «pingilino» «mosca», «gorrión», 
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etc.). Balota y Chumbley interpretaron que el efecto de la frecuencia encontrado en otros 
estudios, sobre todo en los basados en la tarea de decisión léxica, que es donde se observa de 
forma más notoria, era debido a las peculiaridades de la propia tarea, concretamente, al propio 
proceso de «toma de decisión». Estos autores consideran que la frecuencia de uso no influye 
realmente en el acceso al léxico mental, sino en el proceso posléxico de la toma de decisión. 
Otro tanto podría decirse de la tarea de detección de fonemas, que también implica una 
decisión. 
La cuestión del locus de esta variable es todavía un debate abierto. Muchos autores defienden 
que la frecuencia léxica tiene una influencia real y automática en el reconocimiento de las 
palabras, y que surge en tareas que no requieren ningún tipo de decisión. Por otra parte, el 
efecto de la frecuencia léxica podría quedar subsumido u oscurecido en las tareas de catego- 
rización semántica, en las que los tiempos son mucho más largos e influyen poderosamente 
otras variables, en particular la tipicidad de cada ejemplar dentro de una categoría. Por 
ejemplo, un gorrión o una gallina son ejemplares más típicos de «ave» que un pingúino, y esta 
variable ejerce una fuerte influencia en los tiempos de reacción. 
Sin embargo, es difícil aislar el efecto de esta variable del de otras con las que normalmente 
guarda relación en el vocabulario de un idioma. La variable frecuencia léxica tiende a 
relacionarse con otras variables, como el grado de concreción, el número de significados, la 
longitud de la palabra, etc., que también afectan a los procesos léxicos. Una de ellas, que cada 
vez cobra más importancia, es la edad de adquisición de cada palabra. 

+ Edad de adquisición 
La edad de adquisición se refiere la edad a la que se aprende cada palabra a lo largo de la vida. 
Algunas palabras ya son conocidas por los niños durante los primeros años de su vida, otras las 
aprenden cuando empiezan la escolaridad y otras no las aprenden hasta edades bastante 
tardías. Numerosos experimentos han mostrado que la edad de adquisición es una variable 
muy determinante del reconocimiento de las palabras, con independencia de la metodología 
que se utilice, hasta el punto que algunos autores sostienen que es incluso más importante que 
la frecuencia de uso, puesto que muchos de los efectos que se habían atribuido a la frecuencia 
en realidad corresponden a la edad de adquisición. En efecto, frecuencia y edad de adquisición 
son variables muy relacionadas, dado que normalmente las palabras que los niños aprenden 
antes son las más frecuentes y las que aprenden a una edad tardía son palabras de baja 
frecuencia; así pues, los experimentos que no tuvieron en cuenta la edad de adquisición y sólo 
consideraron la frecuencia estaban, sin duda, atribuyendo a la frecuencia más efectos de los 
que le correspondían. De ahí que en la actualidad los estudios tengan en cuenta ambas 
variables, pues desde el punto de vista metodológico se pueden separar los efectos de ambas, 
bien mediante técnicas estadísticas (p. ej., por medio del análisis de regresión comprobando el 
peso de cada de una de las variables), bien mediante diseño factorial, ya que ciertamente se 
pueden encontrar palabras de alta frecuencia y de edad de adquisición tardía (p. ej., proceso) y 
palabras de baja frecuencia y de edad de adquisición temprana (p. ej., hada). Los resultados 
muestran que, efectivamente, las dos variables tienen efectos independientes y que ambas son 
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importantes. Cuál de ellas tiene efectos mayores depende de la tarea; así, en decisión léxica el 
efecto de la frecuencia es mayor, y en categorización semántica, es la edad de adquisición la 
más influyente. 

Un problema de la variable edad de adquisición es que es más difícil de cuantificar que la 
frecuencia. Si para la frecuencia basta con tomar un buen número de textos y, con un programa 
informático, contar las veces que aparece cada palabra, con la edad de adquisición la tarea de 
saber en qué momento aprenden por lo general los niños cada palabra es realmente 
complicado. En algunos casos se hacen análisis de los registros del habla de los niños, pero el 
problema es que éstos no utilizan todas las palabras que conocen. Otras veces se pregunta a los 
padres o profesores sobre las palabras que creen que sus hijos o alumnos conocen. La medida 
objetiva más aceptada fue la utilizada por Morrison, Chappell y Ellis, consistente en presentar 
dibujos de objetos a niños de diferentes edades para que los nombraran. Es evidente que si los 
niños nombran un dibujo significa que han adquirido esa palabra. Y si la mayoría de los niños 
de una edad determinada nombran ese dibujo, puede deducirse que por término medio los 
niños de esa edad ya conocen la palabra. Por lo tanto, cada dibujo se va probando en distintas 
edades y se toma como punto de corte cuando una mayoría de cierta edad es capaz de nombrar 
el dibujo, pero sólo unos pocos de la edad inferior no consiguen nombrarlo. Por ejemplo, si 
sólo el 25 % de los niños de 3 años de edad consiguen nombrar el dibujo de un león, pero lo 
consigue el 60 % de los de 4 años, se considera los 4 años la edad de adquisición de esa 15 
palabra. 

Este procedimiento es objetivo pero ciertamente muy arduo cuando se quiere obtener una 
amplia base de datos sobre la edad de adquisición. Por lo general, las bases de datos contienen 
miles de palabras para que los investigadores tengan dónde elegir y con este procedimiento es 
realmente costoso recoger datos para muchas palabras. Por otra parte, con este procedimiento 
no se pueden recoger datos para las palabras abstractas que son imposibles de representar 
mediante fotografías o dibujos (¿cómo obtener datos para palabras como dogma, mente o 
proceso?). Por esa razón, las medidas más utilizadas son las denominadas escalas subjetivas de 
edad de adquisición. Estas se obtienen presentando una lista de palabras a adultos para que 
puntúen sobre una escala (generalmente de 1 a 7) la edad a la que creen que aprendieron cada 
palabra. El 1 significa antes de los 2 años de edad, el 2 entre 3 y 4 años, etc. Aunque parezca 
una medida muy subjetiva, los valores que se obtienen con este procedimiento guardan una 
correlación muy alta con los obtenidos presentando dibujos a los niños, por lo que es la más 
utilizada por los investigadores. 

A la hora de seleccionar estímulos para los experimentos, hoy ya existen estudios normativos 
sobre palabras castellanas que incluyen la variable edad de adquisición utilizando medidas 
subjetivas (Izura, Hernández-Muñoz y Ellis, 2005) y también con medidas objetivas (Álvarez 
y Cuetos, 2007). 

Por otra parte, algunos investigadores se plantean si el verdadero efecto de esta variable es la 
edad de adquisición per se o es, en realidad, el orden de adquisición que siguen unas palabras 
respecto a otras (Izura y Ellis, 2002). 
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+ Lexicalidad 
En la tarea de decisión léxica, el tiempo nefario para decidir que un estímulo es una palabra 
suele ser, en general, más corto que el que se requiere para decidir que no es una palabra. De 
alguna manera, el participante «agota» su diccionario o léxico mental sin encontrar una unidad 
léxica que se acople con el estímulo y responde con el botón «no». Esta operación consume 
más tiempo que la localización de una unidad léxica y que la respuesta «sí». Pero esto ocurre 
siempre que se cumpla una condición: que los estímulos no-palabras se ajusten a las normas 
ortográficas y fonológicas del idioma; es decir, que sean pronunciables y presenten secuencias 
admitidas en la lengua, como «mizo», «pecil», etc.; son lo que técnicamente se denominan 
seudopalabras. Cuando esto no se cumple, los tiempos de rechazo son muy cortos porque el 
sujeto, probablemente, ni siquiera intenta acceder a su léxico mental. Así, la secuencia 
«xghytz» es inmediatamente rechazada como no-palabra, sin ningún intento de búsqueda 
léxica. Por otra parte, las seudopalabras tardan más en ser rechazadas cuanto más se parecen a 
alguna palabra existente (Coltheart et al., 1977) o incluyen una palabra en su interior (p. ej., 
«camaler» incluye la palabra «cama», Sánchez-Casas y García-Albea, 1984). 

* Vecindad fonológica 
Se consideran vecinos fonológicos de una palabra todas aquellas que comparten todos los 
fonemas, excepto uno, y en las mismas posiciones. -Así, las palabras «topo», «tino», «tomo», 
«tuno» y -toro» son vecinas de «tono». Hay palabras con muchos vecinos, podría decirse que 
habitan en vecindarios muy densos o populosos; por ejemplo, «casa» tiene como vecinos a 
«masa», «pasa», tasa», «gasa», «Cosa», «Capa», «Cama», «Cava», -Cana», etc. En el otro 
extremo están las palabras ermitaños, que no tienen vecinos, como «tifus». 
La mayoría de los estudios encuentran que la vecindad fonológica tienen efectos inhibitorios 
en el reconocimiento de palabras habladas, ya que, cuantos más vecinos tiene una palabra, más 
se tarda en reconocerla (Luce y Pisoni, 1998; Ziegler, Muneaux, y Graiger, 2003). La 
explicación más intuitiva de este efecto es que cuantos más vecinos tiene una palabra, mayor 
es el número de competidores que hay que inhibir para lograr su reconocimiento. 
Además del número de vecinos o densidad de vecinos (índice N), también es importante la 
frecuencia léxica de estos vecinos, ya que si se trata de vecinos de alta frecuencia es más difícil 
su inhibición. Cuando una palabra tiene muchos vecinos y, además, éstos son de alta 
frecuencia, sus tiempos de reconocimiento son mucho mayores que cuando tiene pocos 
vecinos y éstos son de baja frecuencia. 

+ Efecto del contexto (priming) 
Desde hace mucho tiempo, en concreto desde los estudios que Cattell realizó a finales del siglo 
XIX, sabemos que el reconocimiento de las palabras se realiza más rápidamente si van 
precedidas de un contexto con el que guardan relación. Este contexto puede ser una oración, 
por ejemplo cuando escuchamos «libro» después de la oración «Jorge se sentó en la mesa de la 
biblioteca y se puso a leer un...», o puede ser una sola palabra. En unos experimentos clásicos, 
Meyer y Schvaneveldt (1971) comprobaron que las personas reconocen más rápidamente la 
palabra «mermelada» cuando va precedida de «mantequilla» que cuando va precedida de otra 
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palabra no relacionada, como puede ser «enfermera». Por el contrario, la palabra «doctor» es 
reconocida más rápidamente precedida de «enfermera» que de «mantequilla». 

Este efecto que el contexto previo tiene sobre el reconocimiento de palabras, especialmente 
cuando se trata de una palabra previa sobre la siguiente, se conoce con el término inglés de 
priming. Hay un acuerdo tácito en mantener el término original de priming en lugar de alguna 
traducción al español, como «preparación» o «imprimación», porque es un fenómeno muy 
conocido entre los psicolingilistas y les parece más preciso ese término que ninguna de sus 
posibles traducciones. También se mantienen los términos originales prime para referirse al 
estímulo previo (en el ejemplo, «mantequilla») y el de target para la palabra que se tiene que 
reconocer («mermelada»). 

En los experimentos típicos de priming se presenta un punto de fijación (p. ej., un asterisco) 
durante 500 o 1.000 ms, después se presenta el prime durante un tiempo muy breve, en torno a 
los 250-500 ms y un momento después se escucha el target ú que los sujetos tienen que 
responder. La separación entre el prime y el target suele ser un tiempo muy breve, unos pocos 
milisegundos, y se denomina stimulus onset asinchrony (SOA). La siguiente es una secuencia 
típica de un experimento de priming con una SOA de 400 ms: 


e (500 ms) 
Prime (300 ms) 
Silencio (100 ms) 


Target (500 ms) 

Los efectos del priming se calculan siempre comparando los tiempos de reconocimiento de la 
palabra target cuando va precedida del prime (mesa-silla) respecto a si va precedida de una 
palabra no relacionada (p. ej., coche-silla). Dichos efectos pueden ser facilitadores, si 
disminuyen los tiempos de reconocimiento, o inhibidores, si los aumentan. El hecho de que los 
efectos sean facilitadores o inhibidores depende del SOA y del tipo de relación entre prime y 
target. 
Como se verá en el capítulo 11, hay varios tipos de priming en función del SOA y de la 
relación entre el prime y el target ([priming semántico, priming fonológico, priming de 
repetición, etc.). También existe priming afectivo, cuando existe relación emocional entre las 
palabras, y priming sintáctico, cuando se facilitan ciertas estructuras sintácticas. 
Finalmente, hay que destacar que el fenómeno del priming afecta sólo a las palabras reales, no 
a los estímulos que son no-palabras. Así, en el priming de repetición existe una facilitación en 
el caso de «mesa-mesa», pero no en «nizo-nizo». Esto indica que se trata de un efecto 
lingúístico, y no puramente perceptivo. 

e Otras variables 
Hay además otras variables que, aunque menos influyentes que las anteriores, también tienen 
efectos sobre los tiempos de reconocimiento. Por consiguiente, los trabajos experimentales 
deben poner especial cuidado en el control de variables que no son objeto de estudio, pero que 
podrían influir y oscurecer los resultados, sobre todo las más potentes, como la frecuencia 
léxica. A continuación se enumeran las más conocidas. 
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Imaginabilidad. Se refiere a la facilidad con que uno puede imaginar el significado de una 
palabra. Hay palabras fáciles de imaginar, como «cuchillo», «gato» o «libro», y otras en la que 
es muy difícil producir una imagen, como «verdad», «ética» o «maldad». Se ha demostrado 
que las palabras concretas y altamente imaginables se recuerdan mejor que las abstractas y 
difícilmente imaginables en las pruebas de memoria (Paivio, 1971). Las palabras concretas 
producen mejores tiempos en la tarea de decisión léxica, sobre todo en las palabras de baja 
frecuencia léxica (de Groot, 1989). En experimentos de priming, las palabras concretas 
facilitan mejor a las concretas, y las abstractas a las abstractas. 

Al igual que la edad de adquisición, la imaginabilidad se mide a través de cuestionarios 
subjetivos en los que los participantes tienen que puntuar sobre una escala, generalmente entre 
los valores 1 y 7, la facilidad para imaginarse el significado de una palabra. Así, palabras, cuyo 
significado es fácil de imaginar, como «árbol», «tijeras», etc., obtienen una puntuación 
próxima a 7, y palabras que refieren a conceptos difíciles de imaginar, por ejemplo, «dogma», 
«bondad», etc., obtienen puntuaciones próximas a 1. 

Aunque se trata de conceptos diferentes, la imaginabilidad está estrechamente relacionada con 
la variable concreción/abstracción, dado que los objetos concretos son fáciles de imaginar y 
los abstractos difíciles de imaginar. No obstante, no son conceptos exactamente iguales, ya 
que hay conceptos abstractos a los que se les ha puesto una imagen; por ejemplo, «justicia» es 
una palabra abstracta, pero solemos imaginarla como una mujer con los ojos tapados y una 
balanza en la mano. Un problema con la variable imaginabilidad es que, al ser cuantificada 
mediante escalas subjetivas, puede ser afectada por otras variables relacionadas y que los 
sujetos no pueden separar, por ejemplo, la familiaridad o la frecuencia. No obstante, en 
numerosos estudios, a través de análisis estadísticos, se ha puesto de manifiesto la influencia 
independiente de la imaginabilidad. 

Polisemia. La polisemia, o número de significados que tiene una palabra, es otra variable 
relevante en el reconocimiento de las palabras. Aunque se han obtenido resultados 
contradictorios, la mayoría de ellos indican que las palabras que tienen mayor número de 
significados se reconocen más rápido que las que tienen pocos significados, especialmente 
cuando se trata de palabras de baja frecuencia (Cuetos, Domínguez y de Vega, 1997; 
Jastzrembski, 1981). Hay que aclarar que los significados de las palabras polisémicas tienen 
cierto parentesco semántico; por ejemplo, la palabra «cabeza» puede referirse a parte 
sobresaliente del cuerpo humano, unidad de ganado, parte prominente del alfiler, jefatura o 
dirección, inteligencia, etc. Por el contrario, las denominadas palabras homógrafas tienen 
también varios significados, pero sin la menor relación entre ellos («banco» referido a mueble 
urbano, a entidad monetaria o a grupo de peces). Los efectos de polisemia son más acusados 
cuanta mayor implicación semántica exija la tarea, por lo que aparecen en la tarea de decisión 
léxica, pero más aun en la de categorización semántica. Por otra parte, es también importante 
que todos los significados de la palabra vayan en la misma dirección (polisemia), pues cuando 
los significados son distintos (homografía) los resultados no son tan claros. 
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Morfología. Una cuestión muy debatida en psicolingiística es cómo están representadas las 
palabras morfológicamente complejas en el léxico y cómo se accede a ellas durante el proceso 
de reconocimiento de las palabras escritas. Esta cuestión ha generado muchos estudios, 
especialmente en castellano, al tratarse de una lengua de una gran riqueza morfológica, en 
comparación con la relativa pobreza del inglés. Esto ha proporcionado a los investigadores en 
lengua castellana posibilidades de estudio vedadas a los investigadores anglosajones. Por 
ejemplo, el procesamiento de los afijos de género de los nombres y adjetivos o el del modo 
subjuntivo de los verbos en castellano, ambos características inexistentes en inglés. 

Como vimos anteriormente al tratar la organización del léxico mental, se han propuesto dos 
hipótesis alternativas sobre el reconocimiento de las palabras morfológicamente complejas. La 
hipótesis del listado exhaustivo sostiene que cada palabra compuesta tiene su propia 
representación léxica independiente. Según esta hipótesis, la frecuencia de cada palabra es la 
que determina los tiempos de reconocimiento. La hipótesis de la segmentación obligatoria, en 
cambio, mantiene que las palabras son segmentadas en sus morfemas componentes, por lo que 
se accede a la raíz y a los afijos de manera independiente. Por lo tanto, lo que determina el 
reconocimiento es la frecuencia de la raíz y de los afijos correspondientes. Actualmente, la 
hipótesis más defendida es una versión híbrida de los dos anteriores: el modelo mixto o dual 
que asume ambas posibilidades de procesamiento. Las palabras de morfología irregular y las 
palabras frecuentes cuentan con su propia representación léxica, por lo que se reconocen 
directamente, y las palabras regulares y de baja frecuencia se descomponen en raíz y afijos. 
Contenido emocional. El contenido emocional de las palabras también influye en su 
procesamiento. A igualdad de otras condiciones, los tiempos de reacción son más rápidos para 
las palabras con alta carga en determinadas dimensiones emocionales (Wurm, Vakoch y 
Seaman, 2004). Un caso particular relacionado con el contenido emocional de las palabras lo 
constituyen las denominadas palabras tabú. Desde hace tiempo se sabe que éstas no se 
procesan igual que las otras palabras y que se recuerdan mejor en pruebas de memoria y, 
además, deterioran el recuerdo de la palabra precedente y posterior dentro de una lista 
(MacKay et al., 2004). Parece que las palabras tabú «absorben recursos de procesamiento»; la 
discusión se centra en si este fenómeno es automático e inevitable o se halla bajo control 
voluntario. 


MODELO DE RECONOCIMIENTO DE PALABRAS 
e ¿Por qué un modelo? 

La ciencia recurre a teorías y modelos teóricos para avanzar y entender mejor lo que nos rodea. 
Un modelo pretende ser una construcción teórica que representa cierta realidad de difícil 
manejo u observación directa. Necesitamos modelos para entender aspectos de la realidad que 
escapan a nuestra intuición: los orígenes y el cambio (el Big Bang sobre el origen del universo, 
los modelos sobre el origen de la vida, la evolución de las especies), el espacio, etc. Los 
modelos intentan dar una explicación más acertada de la realidad, oponiéndose muchas veces 
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a nuestra intuición: pese a toda apariencia, la tierra no es plana; no es el Sol el que se mueve en 
el cielo durante el día, etcétera. 

Con frecuencia el ser humano entra en contacto con fenómenos empíricos que tardarán siglos 
en ser explicados. El hombre del Neolítico domaba animales sin saber media palabra de 
condicionamiento clásico u operante. Los griegos de la antigúedad conocían las propiedades 
eléctricas del ámbar, pero tendrían que esperar dos milenios para que la teoría electrónica de la 
materia explicara su mecanismo íntimo. En realidad, la explicación nunca es cabal: nuestra 
comprensión actual de las partículas subatómicas, sobre la que descansa la teoría electrónica, 
es muy incompleta y contradictoria. 

Un modelo ofrece una visión unificadora sobre fenómenos dispersos cuya conexión no es 
evidente a primera vista. Por ejemplo, la teoría de la deriva de los continentes da sentido a 
múltiples observaciones geológicas hasta entonces desconectadas. Las teorías y los modelos 
ayudan a conocer mejor la estructura de la naturaleza y, en consecuencia, a mejorar nuestra 
existencia. La teoría microbiana de las enfermedades llevó a Pasteur a salvar muchas vidas, 
simplemente convenciendo -no sin esfuerzo- de la importancia de lavarse las manos antes de 
asistir a un parto. 

Los modelos no se construyen en el vacío, sino que parten de datos de la realidad, pero, al 
proporcionar una visión más completa del fenómeno, son fuente de nuevas hipótesis que 
deben ser verificadas otra vez de forma empírica. Es un camino de ida y vuelta entre el modelo 
y el fenómeno real. De esta manera, los modelos tienen capacidad predictiva. 

Por otra parte, no existe el modelo perfecto, que lo explica todo bien y para siempre. El prin- 
cipio de falsabilidad de Karl Popper establece que una buena teoría debe ser falsable, refutable 
por los datos. La historia de la ciencia es la historia de cómo se van desechando modelos que 
son sustituidos por otros más potentes. El modelo clásico de Newton funcionaba bien para 
nuestra física de velocidades cotidianas, pero no a una escala cósmica con velocidades 
cercanas a la de la luz. Entender el universo exigió la teoría de la relatividad general y contar 
con las deformaciones del espacio-tiempo, despreciables a escala terrestre. 

Para que los modelos sean útiles, deben establecer predicciones específicas que puedan ser 
verificadas o falseadas. Un modelo que prevea vagamente que todo se relaciona con todo no 
sirve de mucho. Según Popper, cada buena teoría científica es realmente una prohibición: 
prohibe que ciertas cosas ocurran; para él, cuantas más prohibiciones, mejor será la teoría, más 
especificas serán sus predicciones. Una teoría psicológica (p. ej., el psicoanálisis) que intente 
explicarlo todo a posterior a una cosa y también su contraria, que no plantee a priori hipótesis 
específicas empíricamente verificables, ayuda poco al avance acumulativo de la ciencia y no 
permite superar los argumentos circulares meramente especulativos. 

Muchos modelos científicos se basan en una analogía que les abre nuevas oportunidades. El 
modelo de Maxwell adquirió todo su valor cuando el autor concibió las fuerzas 
electromagnéticas como análogas a los fluidos. La dinámica de gases se entendió mejor a 
partir del modelo de bolas de billar, y esto permitió anticipar predicciones que luego se 
confirmarían. Más recientemente, el modelo del saco del Instituto Tecnológico de 
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Massachusetts (MIT) sobre el confinamiento de los quarks abrió nuevas perspectivas en física 
cuántica. Los procesos mentales pertenecen a un dominio más resbaladizo que el físico, dada 
la enorme cantidad de variables intervinientes no controladas, pero la analogía del ordenador y 
el procesamiento de la información ha sido útil durante cuatro décadas. Hoy muchos autores 
apuntan hacia la analogía del propio cerebro: su microestructura debe servir de guía, hay que 
caminar hacia modelos de estructuras reticulares altamente interconectadas. En el campo 
específico de la psicolingúística, la analogía del diccionario mental ha tenido una poderosa 
influencia en la investigación sobre el procesamiento de las palabras. 
Los modelos teóricos sobre el acceso léxico nacieron para intentar explicar y dar coherencia a 
los hallazgos empíricos obtenidos hasta el momento (efecto de frecuencia, priming, etc.). Su 
potencia explicativa crecerá en la medida en que también expliquen nuevos datos que vayan 
apareciendo con posterioridad. Desgraciadamente, la psicolingiística, como la psicología 
cognitiva en general, es una disciplina científica en la que apenas existen, todavía, áreas con un 
modelo único admitido por todos. Por el contrario, es normal que varios modelos alternativos 
compitan por explicar mejor los subprocesos modelados, y la evidencia empírica tiende a 
repartirse entre ellos. La realidad mental es bastante escurridiza y muchas veces juega al gato y 
al ratón con los investigadores; se resiste a mostrar regularidades sencillas fácilmente 
“Capturable”. En ocasiones, pequeñas variaciones en las condiciones experimentales conducen 
a resultados contradictorios. Una situación habitual es que originalmente un modelo surge con 
una estructura relativamente simple y parsimoniosa, elegante en términos científicos, y, sin 
embargo, la necesidad de explicar nuevos resultados que no encajan bien obliga después a 
complicar el modelo. 
Los modelos del acceso léxico se dividen fundamentalmente entre los que defienden un acceso 
directo al léxico mental (p. ej., modelo del logogén) y los que consideran la existencia de algún 
tipo de mecanismo de búsqueda serial (modelo de Forster). El modelo de cohorte de 
Marslen-Wison se califica de híbrido en este sentido. A continuación se abordarán estos 
modelos, así como, brevemente, los nuevos modelos conexionistas. 

e Modelos de acceso directo: modelo del logogén 
En los años setenta y siguientes, John Morton planteó un modelo que ha sido muy influyente 
en la investigación sobre el reconocimiento de las palabras (Morton, 1969, 1982). En este 
modelo, cada palabra que conocemos estaría representada en nuestra memoria por un 
dispositivo denominado logogén. Se trataría de un mecanismo que acumula evidencia o 
activación respecto a una palabra y, cuando la activación alcanza un umbral prefijado, el 
logogén se dispara, reconociendo la palabra. Cuando entra información en el sistema o 
conjunto de logo-genes, éstos acumulan activación sobre sus palabras hasta que uno de ellos 
alcanza su umbral y resulta «ganador». Los logogenes compiten entre sí en la identificación de 
las palabras y, mientras no están activos, mantienen un cierto nivel de activación basal o de 
reposo. 
Se trata de un modelo de acceso directo porque la búsqueda léxica no ocurre de forma serial, 
sino que desde el principio toda la información es accesible al sistema completo de logogenes 
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y éstos reciben activación en paralelo. Es como si en un cuarto oscuro, lleno de lámparas 
apagadas, una o varias de ellas se encendieran total o parcialmente: serían detectadas de forma 
directa sin necesidad de un mecanismo de búsqueda secuencial. 


Análisis Análisis 
visual auditivo 

Sistema Sistema 
de logogenes cognitivo 


Almacén 
de salida 


Figura 6-2. Modelo del logogén de reconocimien- 
to de palabras, en su formulación original (Morton, 


1969). 


De acuerdo con la formulación original del modelo 
(Fig. 6-2), al sistema de logogenes llega 
información en paralelo desde tres fuentes 
distintas: representaciones ortográficas obtenidas 
por el análisis visual de las palabras escritas, 


representaciones auditivas de las palabras 
habladas, y representaciones semánticas 
procedentes del sistema cognitivo. Las dos 


primeras son fuentes externas al sujeto porque 
corresponden a la información de entrada del 
estímulo, mientras que la tercera es información 
interna que procede de su propio sistema cognitivo. 


Esta última es la que utilizamos en la producción del lenguaje, al nombrar dibujos u objetos, o 
cuando pensamos en las palabras que vamos a emplear. 


Activación de un logogén 


AA 


Priming de repetición 


pa 


Palabra 
muy frecuente 


Estímulo 
(2* vez) 


Palabra 
poco frecuente 


Efecto de la frecuencia 


A 
A YA 
ha. 


AM 


ENFERMEDAD QUIRÓFANO 
Priming semántico 


Figura 6-3. Interpretación de algunos fenómenos 
empíricos por el modelo del logogén de Morton (véase 
explicación en el texto). 


Ahora bien, el sistema de logogenes no hace distinción 
entre las fuentes, y para él las tres son externas. Una vez 
que la información ingresa en el sistema de logogenes, ésta 
tiene el mismo valor funcional independientemente de cuál 
ha sido su origen; «no se le pide el DNI» a cada 
información, todas son funcionalmente equivalentes. De 
este modo, Morton explica el efecto del contexto: en la 
medida en que los logogenes disponen de mayor 
información procedente del sistema cognitivo, es decir, la 
denominada información arriba-abajo proveniente de los 
procesos superiores, necesitará menos información sobre 
el estímulo (de abajo-arriba) para la identificación de las 
palabras. Mientras leemos o escuchamos lenguaje 
organizado y coherente, nuestro sistema cognitivo elabora 
en tiempo real una representación del significado y, en 
consecuencia, envía información al sistema de logogenes, 
preactivando determinadas palabras congruentes con el 
mensaje; así, gracias a este efecto del contexto, esos 
logogenes necesitarán menos información de entrada para 
dispararse y llevar a cabo la identificación léxica. Según 
esto, se trata de un modelo interactivo, porque la 
información contextual ejerce su influencia desde el primer 
momento en el proceso de reconocimiento de palabras. 
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El modelo explica la mayor parte de los fenómenos empíricos conocidos en el momento de su 
formulación (Fig. 6-3). Veamos algunos. Después de que un logogén ha sido activado al 
identificar una palabra, su activación desciende al nivel de reposo, pero esto no ocurre de 
forma instantánea, sino que lleva cierto tiempo. Por lo tanto, las palabras recién activadas 
retendrán una activación residual superior a la de reposo durante un corto período de tiempo; si 
en ese momento el estímulo de entrada vuelve a activar el mismo logogén, éste se disparará 
antes, reconociendo de nuevo la palabra con mayor facilidad. Es así como se explica el 
priming de repetición. 

Morton propone que cada logogén tiene un umbral de disparo distinto. Las palabras de alta 
frecuencia, que son familiares al sistema de logogenes porque se han presentado muchas veces 
a lo largo de la vida del sujeto, cuentan con logogenes con un umbral más bajo. Por eso se 
activarán antes que las palabras poco frecuentes, que tienen umbrales más altos y necesitan 
mayor cantidad de activación antes de alcanzarlo. Así es como el modelo explica el efecto de 
la frecuencia léxica. 

Por otra parte, los logogenes están conectados entre sí de manera que se comunican la 
activación, y ésta se extiende entre los logogenes cercanos, si bien este proceso tampoco 
sucede de forma instantánea. Las palabras semánticamente próximas, con significados 
similares, tienen logo-genes cercanos entre sí y con mayor probabilidad de comunicar sus 
respectivas activaciones. De este modo, Morton explica el efecto del priming semántico. 
Cuando, por ejemplo, leemos la palabra «hospital», se activa su logogén, y parte de su 
activación se comunica a los logogenes próximos, como «doctor», «enfermedad», 
«ambulancia», «quirófano», etc. Si en ese momento entra información congruente con la 
palabra «doctor», su logogén se disparará antes gracias a la activación recibida desde el 
logogén «hospital». 

Respecto a cómo se procesan las no-palabras en este modelo, Coltheart, Davelaar, Jonasson y 
Besner (1977) sugirieron la existencia de un tiempo límite para reconocer las palabras en el 
sistema de logogenes. Una vez agotado este plazo sin que se haya disparado ningún logogén, 
se rechaza el estímulo como no-palabra. Si éste guarda cierto parecido superficial con algunas 
palabras, se tardará más en el rechazo porque habrá activación parcial de sus logogenes. 
Morton no pudo mantener la sencillez de su esquema original porque no era capaz de explicar 
algunos datos experimentales que iban apareciendo. Por ejemplo, el modelo opera únicamente 
con unidades léxicas, por lo que no está claro cómo se procesan las unidades subléxicas, como 
las sílabas y otras. Una debilidad importante es que el modelo predice que un cambio de 
modalidad en la información, de visual a auditiva, o viceversa, no debe afectar a los procesos 
de facilitación o priming. Por ejemplo, la identificación previa de una palabra escrita debería 
facilitar su reconocimiento posterior, tanto por vía visual como por vía auditiva, pero los 
experimentos demuestran que esto último no es así. En otras palabras, debería existir una 
facilitación clara entre modalidades sensoriales distintas, o priming transmodal de repetición, 
que no es confirmada por los datos. Tampoco se observa facilitación desde el canal cognitivo; 
Winnick y Daniel (1970) demostraron que la lectura en voz alta de una palabra facilitaba su 
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reconocimiento taquistoscópico posterior, pero nombrar una palabra ante un dibujo, o 
producirla en respuesta a una definición, no influye luego en su reconocimiento 
taquistoscópico. 

En respuesta a ello, Morton y sus colegas plantearon una nueva versión de su modelo, algo 
más compleja (Mottoa y Paaxsrawa, (Fig. 6-4). 

Aquí, en lugar de uno, se consideran tres sistemas 
distintos de logogenes: uno por cada modalidad 
sensorial o canal de entrada (visual frente a auditiva), 


más un tercer sistema de salida. De este modo, los 

blica A sistemas se mantienen separados sin influencias entre 
modalidades. Evidencia experimental posterior 
sugirió la necesidad de considerar cuatro sistemas: 
uno para leer, otro para escribir, otro para escuchar y 
otro para hablar. Observaciones adicionales desde la 
neuropsicología, obtenidas a partir de lesiones 


de salida 
cerebrales, sugieren la conveniencia de establecer 


Figura 6-4. Modelo revisado del logogén (Morton y estas separaciones. 
Patterson, 1980). 


Análisis Análisis 
visual auditivo 


Sistema 
cognitivo 


A la luz de los datos experimentales que han ido 
apareciendo durante las últimas décadas, han surgido nuevas versiones y variantes del modelo 2 A 
del logogén, que aquí no se considerarán en detalle. 
e Modelos de búsqueda serial: modelo de Forster 


Estímulo Estímulo 
visual auditivo 
Ortográfico Fonológico Semántico/sintáctico 
Código 


de acceso Puntero 


Ficheros 
de acceso 


(ordenados 
por frecuencia) 


principal 


Figura 6-5. Modelo de búsqueda serial de Forster (adaptado de Forster, 1976). 


Los modelos de búsqueda serial conciben mecanismos semejantes al de identificar una palabra 
en un diccionario convencional. Se explora a través de las entradas léxicas, que están 
ordenadas para facilitar la búsqueda, y, una vez localizada la palabra, el diccionario 
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proporciona toda la información almacenada sobre ella. El modelo más conocido de este tipo 
es el propuesto por Kenneth Forster (Forster, 1976, 1979), cuya formulación original se 
muestra en la figura 6-5. El modelo plantea una búsqueda en dos etapas; la primera se llevaría 
a Cabo a través de ficheros de acceso, y la segunda en un gran archivo maestro o principal. 

La primera fase ocurre en uno de tres posibles ficheros de acceso, específicos de una 
modalidad de información. Uno contiene la información ortográfica de las palabras, o fichero 
de acceso ortográfico para las palabras escritas; otro contiene información acústica y 
fonológica de las palabras habladas, o fichero de acceso fonológico, y el tercero almacena 
información sintáctica y semántica de las palabras y se usa en la producción de lenguaje. 
Cuando una palabra se presenta visual o auditivamente, el estímulo de entrada es convertido en 
una representación perceptiva y enviada al archivo de acceso apropiado para su análisis. Estos 
ficheros proporcionan punteros o indicadores dirigidos al fichero maestro que almacena toda 
la información del léxico mental, incluidos los significados. Para acelerar el proceso de 
búsqueda, los ficheros de acceso están divididos en compartimentos (bins) separados, 
probablemente sobre la base de la primera sílaba o las primeras letras de las palabras. Dentro 
de cada bin, los ítems están ordenados por la frecuencia de uso, con las unidades más 
frecuentes al principio, de manera que éstas son localizadas más rápidamente que las menos 
frecuentes. Se explica así el efecto de la frecuencia de las palabras en la velocidad de 
reconocimiento. 2 5 
Cuando la unidad es localizada en el fichero de acceso, el puntero conduce a la entrada 
correspondiente en el archivo maestro. En ese momento queda disponible toda la información 
lingúística contenida en él. Dentro del fichero maestro hay referencias cruzadas o conexiones 
entre las palabras semánticamente relacionadas. 

Se trata de un modelo de tipo modular porque la información de los niveles lingúísticos 
superiores -oracional y supraoracional- no incide directamente en el proceso de acceso o 
localización de las palabras. El único efecto de contexto que puede darse es a través de las 
referencias cruzadas dentro del fichero maestro y así es como se explica el priming semántico. 
No hay lugar para un efecto temprano del contexto de la frase que pudiera operar sobre el 
acceso léxico. Los efectos de contexto actuarían a través de mecanismos posteriores, o de tipo 
postacceso. Es decir, una vez identificada la palabra, se contrastaría su información 
integrándola en la frase y en otros niveles superiores, pero esto ya sería un mecanismo 
postacceso, una vez que se ha accedido a la unidad léxica. 

El priming de repetición ocurre porque puede haber un cambio temporal en el orden de los 
ítems dentro de cada bin, debido a su uso. Las no-palabras se rechazan una vez que ha habido 
una búsqueda exhaustiva en el bin correspondiente, lo cual en general consume más tiempo 
que la localización de una palabra. 

El modelo de Forster y el planteamiento de un mecanismo de búsqueda serial ha tenido -y 
tiene- gran influencia en la comunidad psicolingúística. Sin embargo, las críticas más 
importantes se dirigen, precisamente, a ese mecanismo serial, que no todos admiten. El 
modelo da cuenta de los principales datos experimentales y predice que los efectos de priming 
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están limitados al priming semántico dentro del archivo principal, sin que, como se ha 
mencionado, el reconocimiento de palabras se vea influido por información de tipo 
arriba-abajo procedente de niveles superiores de procesamiento (frase). 
A partir de su primera formulación, este modelo ha sufrido algunas modificaciones para 
acomodar nuevos hallazgos. Una versión más reciente (Forster, 1989) asume diferentes 
niveles de actividad para las entradas en los ficheros de acceso, para explicar el priming 
basado en las similitudes ortográficas entre los estímulos. Este efecto activaría algunas 
entradas más que otras, lo cual lo hace más parecido a los modelos de activación como el de 
logogén. Otro de sus puntos débiles ha sido la incapacidad para explicar convincentemente 
cómo se pronuncian y procesan las no-palabras (Harley, 2001). 
En los últimos años, Forster (1994) ha incorporado un rasgo de paralelismo sugiriendo que, 
dentro de cada fichero de acceso, se produce una búsqueda simultánea en todos sus bins. 
Además del modelo de Forster, existen otros modelos de búsqueda serial que intentan superar 
algunas de sus limitaciones. Destaca sobre todo el modelo de verificación de Becker (1979) 
que pretende, entre otras cosas, dar una explicación más sofisticada del priming semántico. 
Otro modelo de búsqueda serial, el del diccionario de bolsillo de Glanzer y Ehrenreich (1979), 
plantea que hay a nuestra disposición dos diccionarios mentales: uno que contiene 
información de todas las palabras, y otro que contiene información sólo de las palabras muy 
comunes, de alta frecuencia, a modo de una especie de diccionario de bolsillo. Estos autores 
defienden que el efecto de la frecuencia se debe al uso de uno u otro diccionario, pero, dentro 
de un diccionario, el tiempo de búsqueda no varía con la frecuencia léxica. 

e Modelos mixtos: modelo de cohorte 
El modelo de cohorte de Marslen-Wilson (1987; Marslen-Wilson y Tyler, 1980) supone una 
solución mixta entre los modelos de acceso directo y los de búsqueda serial. Lo es en la medida 
en que postula una secuencia ordenada de etapas, pero en ellas se activan paralela y 
simultáneamente varios elementos léxicos. Se trata de un modelo concebido únicamente para 
las palabras habladas. 
| Los estímulos auditivos necesitan desplegarse en el tiempo y 
no se presentan todos a la vez como ocurre con una palabra en 
una pantalla. El modelo plantea lo siguiente: mientras una 


| 
| 
| 
i ” 
elelante elegido 
| estud >) elefante > 


a» persona está escuchando una palabra (p. ej., «elefante»), desde 

cogo > [ego > [aano > [oeane» | el principio se activan en paralelo un conjunto finito, o 

| [ecuador > [elástico > «cohorte», de palabras congruentes con los sonidos iniciales, y 
els todas ellas serían inicialmente candidatos léxicos del estímulo 


(Fig. 6-6). Son representaciones que compiten en el proceso de 
identificación. Así, al oír la vocal inicial de «elefante» se 
activarían palabras que empiezan por esa vocal, como 
«estudio», «ecuador», «elegido», «elefante», etc. 

Figura 6-6. Modelo de cohorte. A) Algunas delas pa A Medida que el estímulo va ingresando en el sistema 


labras que forman la cohorte de «elefante». B) Porción 


de la onda acústica de dicha palabra. perceptivo, la cohorte inicial se reduce y se van desactivando 
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los candidatos incompatibles con la secuencia de sonidos. Al final sólo queda activo el único 
candidato coherente («elefante») con esa particular secuencia acústica. Hay que tener en 
cuenta que esto suele ocurrir antes de llegar al final de la palabra. El modelo plantea que cada 
palabra tiene un punto de unicidad, o punto óptimo de reconocimiento, a partir del cual la 
palabra queda como candidato único y es reconocida sin esperar al final (p. ej., «elefante» 
tendría su punto de unicidad después de la secuencia «elef»). 

Marslen-Wilson y sus colegas emplearon profusamente la técnica experimental del sombreado 
(shadowing) de frases y otros estímulos lingúísticos; es decir, el participante oye una frase y 
debe seguirla como una sombra, repitiendo cada palabra lo más rápido posible. Pronto 
observaron que las palabras eran repetidas con tiempos de reacción muy cortos, indicando que 
los oyentes las reconocían antes de que finalizaran. No se trataba de una imitación ciega de 
fonemas, porque esto no ocurría cuando los estímulos eran no-palabras (p. ej., «nicepa»). En 
tareas de corrección de errores, una variante del sombreado donde los oyentes deben repetir 
correctamente palabras que tienen algún fonema cambiado (p. ej., repetir «tragedia» al oír 
«travedia»), esos errores se corrigen mejor cuando aparecen en la primera sílaba, que cuando 
surgen en la tercera (Marslen-Wilson y Welsh, 1978). Éstos y otros resultados sugirieron a 
Marslen-Wilson que la percepción de una palabra se basa en un continuo estrechamiento del 
abanico de candidatos posibles hasta alcanzar el punto de unicidad, momento en que se 
produciría la identificación léxica. Ese punto es diferente para cada palabra, dado que depende 
de los otros candidatos. Aquí, la información del contexto puede influir acelerando el proceso 
mediante la eliminación de competidores de la cohorte que son poco congruentes con ese 
contexto. 

Este planteamiento ha tenido gran influencia en toda una generación de psicolingiiistas a partir 
de los años ochenta. En palabras de Jusczyk y Luce (2002, p. 13), «la versión más temprana de 
la teoría de cohorte presagiaba muchos de los temas de los que se habría de ocupar la 
investigación sobre el reconocimiento de las palabras habladas en los años venideros. De 
hecho, muchas cuestiones que dominan actualmente la investigación en este campo tienen sus 
raíces en ella». 

Pese a su enorme impacto teórico, el modelo de cohorte no está exento de puntos débiles, al no 
poder explicar convincentemente algunos efectos empíricos. Esto, al igual que en los otros 
tipos de modelos, ha obligado a revisar algunos de sus planteamientos iniciales y ofrecer 
versiones modificadas del modelo original. De manera que hoy es difícil hablar de un único 
modelo bajo la rúbrica de «cohorte». 

Dos son sus principales debilidades. Por una parte, cualquier mínima discrepancia del 
estímulo en sus partes iniciales lo excluiría inmediatamente de la cohorte y su representación 
no podría ser activada e identificada. Según el modelo, las palabras que difieren en sus 
comienzos dan lugar a cohortes distintas e independientes y, en consecuencia, no ejercerían 
influencias entre sí; pero esto no es cierto. Así, los datos demuestran que cuando se oye la 
palabra beaker (cubeta, vaso de laboratorio), también se activa speaker (hablante) (Allopena, 
Magnuson y Tanenhaus, 1998). Asimismo, se produce la activación de una palabra que está 


booksmedicos.org 


27 


Psicología del Lenguaje — TEMA 6 


incluida dentro de otra -p. ej., lock (cerradura) se activa al oír hemlock (abeto)- (Luce y Cluff, 
1998). Es decir, éstos y otros hallazgos indican que compartir la porción inicial de las palabras 
no es una condición indispensable para que se activen los competidores. 
El segundo punto débil es que no explica bien el efecto de la frecuencia léxica. ¿Por qué 
cuando dos palabras comparten la misma porción inicial hasta el punto de unicidad, como 
«puer/ta» y «puer/to» (ejemplo de Belinchón et al., 1992), se identifica antes la palabra más 
frecuente («puerta») que la menos frecuente («puerto») 

e Modelos conexionistas: "TRACE 
Durante la década de los ochenta surgieron con fuerza los modelos conexionistas. TRACE es 
un modelo altamente interactivo propuesto por McClelland y Elman (1986) para el 
reconocimiento de las palabras habladas, derivado de un modelo anterior sobre las palabras 
escritas (McClelland y Rumelhart, 1981). 
Se trata de un modelo conexionista formado por múltiples unidades simples conectadas entre 
sí (Fig. 6-7). 


Palabras 


Fonemas 


Rasgos 
(sonoro, difuso, etc.) 


Estímulo 


Figura 6-7. Esquema simplificado del modelo TRACE. Dentro de cada nivel, las conexiones son inhibidoras (líneas 

acabadas en circulos). Entre niveles distintos, las conexiones son excitatorias (flechas). 
Estas unidades están organizadas en tres niveles de procesamiento. En la parte inferior, un 
primer nivel correspondiente a las unidades de entrada se encarga de analizar el imput, o 
estímulo entrante, en sus rasgos fonológicos elementales, como sonidos sordos, sonoros, 
difusos, agudos, etc. Este nivel está conectado con el siguiente, que representa a los fonemas. 
Finalmente, el nivel de los fonemas se conecta con el nivel superior correspondiente a las 
palabras. 
En este esquema general, la información fluye desde abajo hacia arriba, pero, al mismo 
tiempo, los niveles superiores influyen sobre los inferiores, facilitándoles la tarea. 
Precisamente, la característica más importante de TRACE es que concede gran importancia a 
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los procesos de arriba-abajo (top-down), de manera que el nivel de las palabras actúa sobre el 
nivel de los fonemas, y éste sobre el de los rasgos fonológicos. 

Dentro de cada nivel, las unidades que lo componen (rasgos, fonemas y palabras) están 
conectadas lateralmente entre sí por conexiones inhibidoras, en una relación de competencia 
mutua. Por el contrario, las conexiones entre niveles distintos son excitatorias, y también 
bi-direccionales. La entrada del estímulo activa distintas unidades de los rasgos, que compiten 
entre sí inhibiéndose mutuamente. Los rasgos «ganadores», con mayor activación, transmiten 
su energía activadora al nivel siguiente de los fonemas, donde también existen inhibiciones 
recíprocas. Finalmente, la activación de los fonemas ganadores se transmite al nivel superior 
de las palabras, donde sólo una -si el estímulo no es ambiguo- resulta ganadora y plenamente 
activada, produciéndose así la identificación o reconocimiento léxico. 

Al mismo tiempo, junto a este procesamiento de abajo-arriba, se da, como se ha señalado, un 
procesamiento inverso de arriba-abajo que ayuda a que resulten ganadoras las unidades 
coherentes con las representaciones superiores. Así, si en un estímulo, por ejemplo la palabra 
«cosa», un fonema (/s/) no ha sido bien pronunciado por el hablante y no es perfecto desde el 
punto de vista acústico, la unidad superior (cosa) retroalimenta al nivel inferior activando los 
fonemas coherentes con ella. En ese caso, aunque el fonema /s/ recibiría poca activación desde 
el estímulo físico, se activaría igualmente gracias a la que recibe desde arriba. Esto es un claro 
ejemplo de efecto de contexto, en concreto, del contexto léxico (palabra) sobre la percepción 
de los fonemas. 

El modelo TRACE ha sido y es muy influyente para toda una generación de nuevos modelos 
de corte interactivo y conexionista. Una de sus ventajas consiste en que puede ser 
imple-mentado matemáticamente en computadores para llevar a cabo simulaciones cuyos 
resultados pueden contrastarse con los obtenidos experimentalmente en seres humanos. 

El modelo explica bastante bien los efectos del contexto léxico y fenómenos asociados, como 
la restauración fonémica y la coarticulación. Localiza apropiadamente los límites entre las 
palabras dentro de una cadena hablada y funciona correctamente con estímulos ruidosos, 
semejantes a los que se dan en condiciones naturales. 

No obstante, TRACE tampoco está exento de problemas. Ciertos efectos experimentales no 
son simulados adecuadamente por el modelo. Uno de sus inconvenientes reside en su propia 
flexibilidad: son muchos los parámetros que pueden ser manipulados en TRACE, pero los que 
se acomodan a unos resultados no son con frecuencia los mismos que se ajustan a otros 
resultados distintos. Por otra parte, la manera en que trata el tiempo en el estímulo de entrada, 
segmentándolo en cortes iguales, no parece muy realista. 


BASES NEUROLÓGICAS 

La comprensión de las bases neurológicas de la percepción del habla ha sido un objetivo 
perseguido durante más de un siglo, desde los trabajos pioneros de Cari Wernicke en 1874. La 
primera hipótesis planteaba que el lenguaje oral se percibía mediante la corteza auditiva, ya 
que los pacientes que presentaban dificultades graves de comprensión (hoy conocida como 
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afasia de Wernicke) sufrían lesiones en la circunvolución temporal superior del hemisferio 
izquierdo. Precisamente esta región, en particular su parte posterior, en la frontera con el 
lóbulo parietal (área de Wernicke), se consideró clave para entender las palabras en el modelo 
clásico de Wernicke-Lichtheim. Este planteamiento inicial se ha visto desafiado un siglo más 
tarde, en las décadas de 1970 y 1980, por dos descubrimientos importantes (Hickok y Poeppel, 
2007). El primero es que algunos trastornos en la capacidad de procesar sonidos del lenguaje 
— fonemas- guardan poca relación con las dificultades de compresión observadas en la afasia 
de Wernicke. El segundo es que la destrucción de la circunvolución temporal superior 
izquierda puede coexistir con una comprensión normal y, por el contrario, con problemas en la 
producción oral. A su vez, desde hace tiempo se sabe que la circunvolución transversa de 
Heschl, que corresponde al área auditiva primaria, en la parte superior de ambos lóbulos 
temporales, interviene directamente en el primer procesamiento de toda clase de sonidos, sean 
lingúísticos o no. Todos estos datos y otros nuevos que fueron surgiendo a partir de la década 
de 1980, tanto desde la neuropsicología en pacientes con lesiones cerebrales, como los 
obtenidos con las técnicas avanzadas de electrofisiología y neuroimagen, han ofrecido un 
conjunto de evidencias difíciles de integrar en un marco teórico único hasta que Hickok y 
Poeppel (2004, 2007) propusieron su modelo de organización cortical de la percepción del 
habla, que abordamos a continuación. 

Hickok y Poeppel plantean en su modelo que la entrada sensorial auditiva es procesada a 
través de dos grandes sistemas o rutas neurales (streams), una ventral y otra dorsal. La ruta 
ventral procesa la señal de habla para su comprensión, mientras que la dorsal proyecta dicha 
información sobre las redes articulatorias del lóbulo frontal izquierdo (Fig. 6-8). Se considera 
que la ruta ventral es bilateral, aunque con importantes diferencias computacionales entre 
ambos hemisferios cerebrales, mientras que la ruta 


dorsal está fuertemente lateralizada en el hemisferio 
Da, izquierdo dominante. 

En este modelo neurológico, la información 
sensorial que se proyecta en el área auditiva 
primaria es sometida a un primer procesamiento en 


Figura 6-8. Esquema simplificado que representa el la parte superior de los lóbulos temporales (zona 
modelo dual de Hickok y Poeppel (2007) sobre la orga-. . .. ; 

nización cortical del procesamiento del habla. Adapta- indicada con fondo blanco en las dos mitades 
do de Hickok y Poeppel (2007). cerebrales presentadas en la Fig. 6-8). En una región 
próxima se lleva a cabo en ambos hemisferios cerebrales un análisis de las características 
espectrotemporales de cualquier estímulo auditivo, sea lingúístico o no. Posteriormente, si se 
trata de una señal de habla, y dependiendo del tipo de tarea ejecutada, la información neural se 
bifurca en los dos grandes sistemas mencionados. Básicamente, el sistema ventral pone en 
contacto el sonido con el significado, la información de la señal acústica con las 
representaciones semánticas y conceptuales del lenguaje. En línea con la antigua 
caracterización de la ruta del «qué», el modelo propone que este sistema o conjunto de redes 
ventrales abarca áreas de la parte media e inferior de ambos lóbulos temporales los cuales, a su 
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vez, están interconectados entre sí a través de las fibras del cuerpo calloso y estructuras 
subcorticales. El sistema involucra múltiples niveles de procesamiento que actúan sobre 
distintos niveles de representación: rasgos distintivos, segmentos fonéticos, estructuras 
silábicas, formas fonológicas de las palabras, rasgos gramaticales e información semántica. 
Según Hickok y Poeppel (2007), no está claro aún, a la luz de la evidencia disponible, si la 
computación del habla implica obligatoriamente a todos estos niveles de procesamiento 
operando de forma serial y jerárquica o, por el contrario, actúan en paralelo y con cierto grado 
de flexibilidad según los requerimientos de la tarea. El hecho de que el sistema ventral sea 
bilateral explica por qué es posible encontrar pacientes con lesiones en las estructuras del 
hemisferio izquierdo que no presenten serias dificultades de compresión oral, mientras que las 
lesiones bilaterales indefectiblemente las causan. 

Dentro del sistema ventral se dan ciertas diferencias computacionales entre los dos 
hemisferios que afectan sobre todo a la escala temporal de integración. Según los datos 
experimentales y observacionales, el hemisferio derecho mostraría selectividad para actuar en 
una escala amplia de 150-300 ms, propia de la información suprasegmental -prosodia o 
entonación- del habla. El hemisferio izquierdo, por el contrario, parece menos selectivo y 
podría actuar tanto en esa escala de integración, como en una escala más corta de 20-50 ms, en 
lo que sería un procesamiento rápido propio del nivel segmental. Esta caracterización algo más 
compleja difiere del punto de vista simple de que el hemisferio izquierdo está especializado en 
el procesamiento rápido de la señal acústica y el derecho en el procesamiento lento. Por otra 
parte, hay evidencia de que la porción anterior o delantera del lóbulo temporal desempeña un 
papel relevante en el procesamiento semántico del habla, sobre todo al nivel de oración. Los 
experimentos basados en las técnicas de neuroimagen funcional presentan a esta área 
selectivamente activada cuando los participantes escuchan palabras organizadas en frases, 
frente a listas no estructuradas de palabras. Este efecto del material estructurado frente al 
no-estructurado puede ocurrir incluso en ausencia de contenido semántico, aunque sí es 
sensible -la activación se modula- a manipulaciones experimentales de carácter semántico. 
La ruta o sistema dorsal estaría fuertemente lateralizada en el hemisferio izquierdo dominante. 
En línea con la antigua caracterización del «dónde» o audición espacial, esta ruta actuaría de 
interface con el sistema motor del lóbulo frontal izquierdo. Desde la parte posterior del lóbulo 
temporal, en la frontera entre el lóbulo parietal y el final de la cisura de Silvio —una región 
clave, equivalente a la denominada área de Wernicke- se extienden los circuitos que conectan 
con amplias regiones del lóbulo frontal que incluyen la denominada área de Broca, en la parte 
inferior, y la corteza premotora en una posición más dorsal. Esta ruta neural corresponde a las 
redes articulatorias y tendría un papel esencial en la integración auditivomotora. Hickok y 
Poeppel (2007) destacan la importancia de las primeras etapas de desarrollo del habla: 
aprender a hablar es esencialmente una tarea de aprendizaje motor guiada por un feedback 
auditivo; durante esa etapa se construyen las piezas básicas o patrones neuromotores que luego 
intervendrán en el lenguaje hablado. Por otro lado, hay evidencia del efecto disruptivo que en 
la edad adulta ejerce sobre la producción del habla la alteración experimental del feedback 
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auditivo, así como las consecuencias en la articulación causadas por una sordera de aparición 
tardía. Los autores sugieren que existen al menos dos niveles de interacción auditivomotora, 
uno estrecho que implicaría segmentos fonéticos, y otro, más amplio, que abarcaría secuencias 
de segmentos y que intervendría principalmente en la adquisición de nuevo vocabulario. En la 
medida en que las palabras se hacen más familiares en su uso, este último nivel de integración 
se volvería más automático y agruparía secuencias motoras más amplias. 

Las lesiones unilaterales en el sistema dorsal causan con frecuencia dificultades en la pro- 
ducción del habla. De especial interés, según los autores, es el cuadro ofrecido por la afasia de 
conducción, en la que el daño se localiza preferentemente en la unión temporoparietal o en las 
fibras del fascículo arqueado, que forma parte de la ruta dorsal. Este síndrome de desconexión 
se caracteriza generalmente por una buena comprensión oral -ya que la ruta ventral está intacta 
o, si no lo está, queda compensada por la del hemisferio derecho—, pero presenta frecuentes 
errores fonémicos en la producción verbal. Es interesante constatar que estos síntomas son 
sensibles a la carga de procesamiento: los errores son más probables cuando se pronuncian 
palabras más largas, palabras menos frecuentes y con menos restricciones semánticas debidas 
al contexto. 

En resumen, este modelo dual pretende integrar un gran volumen de observaciones empíricas, 
tanto próximas como las que se remontan a más de un siglo atrás -observaciones de Cari 
Wernicke-, que incluyen procesos perceptivos básicos, aspectos del desarrollo del habla, he- 
chos neuropsicólogicos y psicolingilísticos, y la evidencia más reciente aportada por las 
técnicas de electrofisiología y neuroimagen funcional. El concepto básico de que la 
información sensorial debe ser procesada por dos sistemas diferenciados, uno conceptual o del 
significado, y otro articulatorio-motor, se ajusta bien a un marco dual también planteado para 
el dominio visual y más recientemente para el somatosensorial. En opinión de Hickok y 
Poeppel, tal similitud a través de distintas modalidades podría indicar que este procesamiento 
dual obedece a un principio más general de organización de los sistemas sensoriales. 


RESUMEN 


e Sorprende la rapidez y eficacia con que comprendemos las palabras habladas, si 
tenemos en cuenta que cuando oímos unos sonidos, en sólo cuestión de milisegundos 
reconocemos de qué palabra se trata de entre las decenas de miles que forman nuestro 
léxico mental. 

e A través de diferentes metodologías conductuales, principalmente basadas en los 
tiempos de reacción podemos inferir cómo están organizadas las palabras en nuestra 
memoria y qué variables determinan la rapidez con que las reconocemos. Debido a que 
los sonidos que forman las palabras llegan secuencialmente a nuestros oídos, y que 
desde el momento en que llegan los primeros ya empieza el procesamiento, una de las 
variables más determinantes sobre los tiempos de reconocimiento es el punto de 
unicidad, o punto en el que sólo hay una palabra que comience por esos sonidos. 
También son importantes la frecuencia de uso de la palabra, la edad de adquisición y la 
vecindad fonológica. 


booksmedicos.org 


IZ 


Psicología del Lenguaje — TEMA 6 


e Basándose en estos resultados se han propuesto varios modelos sobre la forma en que 


están organizadas las palabras en el léxico y las operaciones que realizamos durante su 
reconocimiento. 


e Algunos de esos modelos, como el de logogén de Morton, son de acceso directo, otros 


como el de Foster son de búsqueda serial y otros como el TRACE son interactivos. 
Según el modelo neurológico de Hickok y Poeppel, la señal del habla es procesada a 
través de dos grandes rutas neurales, una ventral y otra dorsal. 


Preguntas de reflexión 


¿Qué nos hace pensar que las palabras de clase cerrada se procesan de manera distinta a 
las de clase abierta? 

¿Qué tipo de palabras morfológicamente complejas estarán representadas de manera 
completa en nuestro léxico mental? Pon algunos ejemplos. 

Haz una lista de las variables más determinantes del reconocimiento de palabras por de 
orden de importancia según tus criterios. 

¿Cuál de los modelos de reconocimiento de palabras te parece que explica mejor los 
datos experimentales? Explica porqué. 
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Objetivos de aprendizaje 
Al finalizar el capítulo el alumno será capaz de: 
e Entender cómo se procesa el significado de las palabras. 
e Familiarizarse con las metodologías experimentales que se emplean en el estudio del 
procesamiento semántico. 
e Conocer los principales modelos de organización y procesamiento semánticos. 
e Comprender las bases neurológicas del sistema semántico. 


INTRODUCCIÓN 

Reconocer una palabra no significa comprenderla. En determinadas ocasiones oímos o 
leemos palabras que nos resultan familiares, que sabemos que son palabras reales que hemos 
oído en otras ocasiones, pero no conseguimos recordar su significado. Esto ocurre 
especialmente con las palabras de muy baja frecuencia. Otras veces nos sucede justo lo 
contrario, es decir, queremos expresar un significado pero no encontramos la palabra 
adecuada (el molesto fenómeno de tenerlo en la «punta de la lengua»). Como se analizará en 
el capítulo 12, estas disociaciones entre palabras y significados son bastante frecuentes en los 
pacientes afásicos. 

En términos del procesamiento lingúístico esta disociación se explica porque reconocer una 
palabra y acceder a su significado son procesos distintos que, además, dependen de áreas 
cerebrales diferentes. Una cosa es reconocer la palabra, lo cual se realiza consultando el 
léxico mental, como vimos en el capítulo 6, y otra comprenderla o acceder a su significado, 
que supone un paso adicional y posterior a su reconocimiento. Esta es la razón por la que 
podemos reconocer una palabra aunque no recordemos su significado y, sin embargo, no 
podemos comprenderla sin haberla reconocido. 

No obstante, nuestro objetivo con las palabras que oímos o leemos siempre es acceder a su 
significado. Rara vez (salvo cuando realizamos alguna tarea psicolingúística) nos 
conformamos con reconocer las palabras sin interesarnos por su significado. 

De hecho, no existe un paralelismo exacto entre los significados, que constituyen la base de 
nuestro conocimiento, y las palabras. Hay significados que se representan con varias palabras 
diferentes (sinonimia), por ejemplo, las palabras burro, asno y pollino se refieren al mismo 
concepto, y hay palabras que representan a varios conceptos diferentes (nomografía), por 
ejemplo «banco». Por otra parte, existen objetos y eventos, incluso cotidianos, que no tienen 
nombre. En inglés o en español no hay una palabra que designe el montoncito de pasta de 
dientes que uno pone todos los días sobre el cepillo (ejemplo de Jay, 2003). Tampoco hay 
una palabra única que se refiera a un árbol muerto, aunque sí existe una palabra específica 
para un cuerpo muerto: «cadáver». Las lenguas difieren en la forma de clasificar y nombrar 
muchos objetos; los extranjeros se sorprenden de la cantidad de términos del español para 
identificar los distintos resultados que se pueden obtener cortando una materia con un 
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cuchillo: «rodaja», «rebanada», «cortada», «loncha», «corte», «filete», «tajada», «lonja», etc. 
(Crystal, 1994). En yiddish, lengua mayoritariamente hablada por personas judías, hay 
multitud de términos para describir la ineptitud, cada uno con un sentido distinto: 'schlemiel', 
'schlimazel', 'shlump, 'shmegegge, 'shmendrick', 'shmo' y 'schmuck' (Rosten, 1968). 
Siguiendo la distinción que en su día propuso el filósofo británico Locke (1632-1704), cabe 
diferenciar entre intensión de la palabra, que se refiere a su significado y especifica las 
propiedades que un objeto debe reunir para ser incluido como miembro de esa clase o 
concepto (p. ej., el concepto de «perrez» o propiedades que debe reunir un objeto para ser 
considerado un perro), y extensión o conjunto de objetos que tienen esas propiedades (todos 
los perros del mundo, reales o imaginarios). La semántica también distingue entre la 
denotación de un término, es decir, su significado objetivo, lo que especifica un diccionario 
sobre él (definición de perro), y sus connotaciones, o conjunto de implicaciones emocionales 
y subjetivas que asociamos al término («bonito», «amenazante», «oloroso»). La gente 
comparte la denotación, pero las connotaciones difieren de una persona a otra. 

Pero ¿qué es el significado? Si preguntamos a alguien en la calle por el sentido de la palabra 
perro, inmediatamente señalará uno que esté a la vista. Así, nos pone en contacto con la 
teoría referencial del significado; es decir, éste consistiría en el objeto (referente) al que la 
palabra hace referencia. Esta fue una de las primeras concepciones filosóficas sobre el 
significado, pero el asunto no es tan sencillo. En el caso de los nombres propios sí es posible 
pensar que se refieren a un objeto o entidad individual (persona, lugar, etc.): «París» 
significa una ciudad específica cruzada por el río Sena y, entre sus propiedades, tiene la de 
ser Capital de un país llamado Francia; «Elvis Presley» se refiere a una persona única que fue 
cantante de rock. Sin embargo, ¿a qué objetos se refieren palabras como «justicia», 
«maldad» o «comodidad»? Podemos creer que es sólo un problema de las palabras 
abstractas, pero volvamos a la palabra concreta «perro». En realidad, esta palabra no se 
refiere a un objeto individual, dado que puede aplicarse a cientos de animales, muy distintos 
entre sí, repartidos por el planeta (desde un chihuahua a un mastín) o imaginarios; tampoco 
se refiere exactamente a un grupo o colección de esos objetos (para eso está la palabra 
«jauría» O «perros» en plural), sino a algo común a todos ellos: el concepto de perro. 

Como planteaba William James, podría esperarse que las miríadas de objetos y eventos que 
continuamente impresionan los órganos sensoriales se presentasen a los organismos como 
una desconcertante confusión, pero no es así. Para la supervivencia es clave que los animales 
agrupen objetos «equivalentes» en clases que requieren una respuesta similar. Para las ranas, 
los objetos pequeños, oscuros y que se mueven de un determinado modo deben agruparse 
dentro de la categoría de «moscas» comestibles (Ta-ylor y Taylor, 1990). Una vez 
clasificados, las variaciones de movimiento, tamaño, etc., entre ejemplares individuales de la 
categoría -la que engulló ayer, la que ve ahora arrastrándose sobre una hoja de la charca- 
pueden pasarse por alto en aras de una economía de la percepción y la respuesta. Los seres 
humanos añadimos a esa capacidad la posibilidad de asignar una etiqueta verbal a ese grupo 
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de objetos equivalentes, «mosca» en este caso (con esto no se está diciendo que humanos y 
ranas categoricemos el mundo del mismo modo). 
Cada significado lo hemos ido adquiriendo a lo largo de la vida en momentos y lugares de- 
terminados (en la escuela, a través de los libros y revistas, viendo televisión, etc.), pero 
pronto nos olvidamos de la información sobre el cuándo y el dónde para quedarnos sólo con 
el concepto. Sabemos lo que es un delfín, un dogma o una batalla, también sabemos que el 
Ebro es un río que pasa por Zaragoza, pero no podemos recordar cuándo y dónde hemos 
adquirido esa información. Partiendo de la distinción clásica de Tulving (1972) entre 
memoria semántica y episódical si yo digo «esta mañana se me ha roto el jarrón que me 
regalaron», activo simultáneamente dos clases de información que tengo archivada en mi 
cerebro. Por una parte, la asociada a un evento y situación específica (memoria episódica): 
mi jarrón particular y la situación concreta de romperse al caer al suelo esta mañana cuando 
lo cambié de sitio en el salón de mi casa. Por otra, activo información almacenada sobre el 
concepto de jarrón: qué es ese objeto, qué propiedades tiene, para qué sirve, etc. Este último 
tipo de información (semántica), a la que pertenecen los significados, no está asociada a 
ningún episodio específico; es una información abstracta, desligada de cualquier tiempo y 
espacio concreto (yo no recuerdo el momento y lugar en que aprendí la palabra jarrón). 

e Metodologías de investigación 
Así como para estudiar el reconocimiento de palabras la tarea más utilizada es la decisión 
léxica, que sólo exige decidir si la palabra que oímos o leemos es real o inventada, para estu- 
diar el sistema semántico la tarea más utilizada es la de categorización semántica, que 
consiste en decidir si el concepto expresado por una palabra pertenece o no a una 
determinada categoría semántica (p. ej., se presenta la categoría «peces» y a continuación 
ejemplares concretos como «tiburón», «sardina» O «serpiente» para que en cada caso el 
participante indique, generalmente mediante dos teclas, si cada ejemplar pertenece o no a la 
categoría). Otra tarea consiste en decidir a cuál de dos categorías semánticas pertenece un 
determinado concepto (p. ej., se presenta la palabra «berenjena» y el participante tiene que 
decidir pulsando una de dos teclas si es una «fruta» o una «verdura»). Las latencias que se 
obtienen en la tarea de categorización semántica son más largas que las que se obtienen en la 
de decisión léxica, incluso aunque se trate de las mismas palabras, justamente porque dicha 
tarea exige la realización de esa operación adicional de acceso al significado. 
Una segunda metodología de investigación también muy utilizada es la de asociación de 
palabras. El experimentador dice una palabra y el participante tiene que responder inmediata- 
mente con la primera palabra que se le ocurra. Se trata de una tarea sencilla pero que propor- 
ciona valiosa información sobre la relación entre los conceptos, ya que las personas 
responden siempre con la palabra más relacionada semánticamente y la mayor parte de las 
respuestas coinciden, como se puede ver en la tabla 7-1, lo que indica una organización 
conceptual similar. De hecho es una tarea con una gran tradición histórica, como se puede 
ver en el recuadro 7-1. 
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Tabla 7-1. Respuestas a la palabra silla 
en un test de asociación de palabras 


Frecuencia 


Respuesta al estímulo silla 
de respuesta 


191 mesa 
127 asiento 
107 sentarse 
83 mueble 
56 sentado/sentada 
49 madera 
45 descanso 
38 taburete 
21 confort 
17 mecedora 
15 mecerse 
13 banco 
12 cojín 
11 patas 
10 suelo 
9 cuarto, escritorio 
8 confortable 
7 comodidad, pierna 
6 de madera, fácil, sofá 
5 asentado, blando, diván, duro, 
Morris 
4 alto, artículo, brazo, marrón 
3 bajo, bastón, canapé, caoba, casa, 


conveniencia, descansar, escalón, 
grande, persona, salón, útil 


2 asentarse, hogar, necesidad, nogal 
americano, redondos, roble, roto, 
1 alfombra, apalear, apoyo, banqueta, 


belleza, blanco, cama, carpintero, 
carreta, cojines, colocado, color, 
corazonada, cuidadoso, despacho, 
espalda, estudio, forma, gente, 
Gobernador Winthrop, goma, habla, 
herramienta, utensilio, inclinado, 
lectura, libro, madero, maestro, 
masivo, mesas, mimos, misión, 
objeto, ociosidad, ocupar, oficina, 
pelo, pie, pies, placentero, placer, 
planta, plataforma, postura, puesto, 
sitio, tamaño, tapicería, tapizado, 
torcido, yo 


Recuadro 7-1. Asociación de palabras 

Desde tiempo atrás, los científicos se han interesado en conocer cómo se relacionan las 
palabras entre sí dentro de nuestra mente. Una de las primeras herramientas que los 
psicólogos tuvieron a su disposición fue el denominado test de asociación de palabras, 
inventado por Sir Francis Galton (1822-1911) y ampliamente utilizado por el psicoanalista 
suizo Cari Jung (1875-1961) como método de exploración de la personalidad. Su lógica es 
sencilla: consiste en presentar una palabra a una persona y pedirle que diga la primera 
palabra que le venga a la mente. De este modo es posible comprobar cómo se relacionan 
unas palabras con otras en la memoria del sujeto. Es algo así como sacar una cereza de un 
cesto y arrastrar otras cerezas con las que forma racimo. 

Lo primero que se puso de manifiesto fue que los participantes tienden a responder con pa- 
labras que tienen una relación de significado con la proporcionada. Es decir, la conexión 
entre palabras basada en el significado resulta más fuerte que otro tipo de conexión, como 
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podría ser la semejanza perceptiva u otra. Es la relación semántica la que parece desempeñar 
un papel clave como principio organizativo de las palabras en nuestra memoria. Cuando se 
presenta el término «aguja», las personas tienden a responder palabras como «hilo», 
«alfiler», o «coser», pero no otras como «clavo» o «pincho», que se parecen visualmente a 
la aguja. 

El primer estudio a gran escala realizado con la tarea de asociación semántica fue el de Kent 
y Rosanoff (1910), en lengua inglesa. A un conjunto de 1.000 hombres y mujeres les 
presentaron una lista de 100 palabras, una a una, para que respondieran con la primera 
palabra que les viniera a la cabeza. Las respuestas a una de ellas (silla) se muestran en la 
tabla 7-1. Puede observarse que las personas tienden a coincidir en sus respuestas: 191 
individuos respondieron «mesa», 127; «asiento», etc.; de hecho, las cuatro contestaciones 
más comunes suman la mitad de todas las respuestas. En el otro extremo tenemos una 
amplia variedad de respuestas idiosincrásicas («caoba», «belleza», «ociosidad», etc.). En 
cualquier caso, prácticamente todas las respuestas guardan una relación de significado con 
el estímulo; nadie responde en función de la semejanza fonética, por ejemplo, nadie contesta 
«milla» o «quilla». 

Los datos de Kent y Rosanoff demuestran que una única palabra activa un amplio rango de 
conocimiento léxico. Dejando de lado las contestaciones idiosincrásicas, las respuestas 
revelan cuatro tipos de relaciones asociativas: a) relaciones taxonómicas, dentro de una 
clasificación semántica (términos coordinados como «mesa», subordinados o hipónimos 
como «mecedora», y supraordenados o hiperónimos como «mueble»); b) atributos o 
propiedades del objeto representado: «madera», «confortable», «duro», «blando»; C) partes 
del objeto: «patas», «asiento», «brazos», y d) términos funcionales: «sentarse», «descanso», 
«mecerse». 


Otras tareas que también se utilizan para estudiar el sistema semántico son la verificación de 
frases, consistente en presentar oraciones en las que se dice que el sujeto de la oración es 
miembro de la categoría expresada por el predicado (p. ej., «el perro es un mamífero», «la 
sardina es un reptil»), para que los participantes respondan rápidamente si son verdaderas o 
falsas; la fluidez verbal, especialmente la categorial, consistente en nombrar durante un 
minuto ejemplares de una determinada categoría semántica (p. ej. animales, frutas, 
herramientas, etc.), o la de asociación semántica, consistente en señalar cuál de dos estímulos 
(dibujos o palabras) está relacionado con un tercero (p. ej., cuál de los estímulos «escopeta» 
y «raqueta» están relacionados con el estímulo «pelota»). Estas dos últimas tareas más que 
en los experimentos de laboratorio se utilizan con los pacientes con trastornos semánticos, 
como veremos en el capítulo 12. 
e Variables determinantes del procesamiento semántico 

Las variables que determinan el procesamiento semántico son diferentes de las que influyen 
en el reconocimiento oral de palabras. Así, variables como la del punto de unicidad o la 
frecuencia léxica, tan determinantes de los tiempos de respuesta en la tarea de decisión 
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léxica, son poco relevantes en las tareas de categorización semántica o en la de verificación 
de frases. 

La variable semántica más importante es, sin duda, la tipicidad, es decir, lo típico o represen- 
tativo que es un ejemplar de su categoría. La manzana es un ejemplar típico de las frutas, el 
gorrión de las aves o el martillo de las herramientas. En cambio, el murciélago es un repre- 
sentante atípico de los mamíferos, y el pingúino es un representante atípico de las aves. En 
todas las tareas semánticas, cuanto más típicos son los ejemplares, menores son los tiempos 
de reacción. La forma de medir la tipicidad suele ser a través de escalas en las que los 
participantes clasifican el grado de tipicidad de cada ejemplar, generalmente de 1 para los 
ejemplares muy atípicos a 7 para los muy típicos. Utilizando este procedimiento, Izura, 
Hernández-Muñoz y Ellis (2005) recogieron datos de tipicidad con una muestra de 50 
participantes para un total de 500 palabras castellanas 

pertenecientes a cinco categorías semánticas: MUERE TES 


. pertenecientes a la categoría de animales, 
animales, partes del Cuerpo, muebles, ropa e ordenadas según sus valores de tipicidadad* 


inteligencia. En la tabla 7-2 se presenta una selección Perro 692. Avestruz 3,68 
' . León 68 Ciervo 492... 
de palabras de la categoría animal, ordenadas de Lobo 6,76  Periquito 4,92 Mosquito3,40 
e . Gato 6,72 Aguila 4,84 Guepardo 
mayor a menor tipicidad, tomadas de ese estudio. Vaca 672 Foca 484 3,32 


a . iZ Oso 6,68 Rana 4,80 Cangrejo 3,28 
Otra variable importante es la edad de adquisición, Oveja 664 Serpiente4.76 En 


; 5 ; e Ti ) h 3 6. : 
explicada en el capítulo 6. Esta variable también Ja a a 


: : A Caballo 6,78  Cigieña 4,6 Colibrí 2,32 
influye en el procesamiento semántico, puesto que las li ad 

primeras palabras que se aprenden desempeñan un Toro 6,48 Iguana 3,72 

papel central en la formación de las categorías E op ll sl: 


(Recuadro 7-2). 


Recuadro 7-2. Papel de la edad de adquisición en la organización del sistema semántico 
La edad de adquisición de las palabras es una variable sumamente influyente tanto en la 
comprensión como en la producción, en el sentido de que las palabras que se aprenden a una 
edad temprana a lo largo de la vida son más fáciles de comprender y están más accesibles 
durante el habla que las que se aprenden a una edad tardía. 

Especialmente, la edad de adquisición desempeña un papel muy relevante, mayor incluso 
que la frecuencia de uso, en las tareas que requieren acceder al significado, como ocurre en 
la denominación de dibujos, la fluidez semántica o la asociación semántica. Su papel, en 
cambio, es más discreto en aquellas tareas en las que el componente semántico tiene menos 
participación, como la repetición de palabras, la decisión léxica o la lectura en voz alta. 

En virtud de esa relevancia en las tareas semánticas, algunos autores (Brysbaert, Van 
Wijnendaele y de Deyne, 2000) sostienen que la edad de adquisición podría ser una variable 
determinante en la organización del sistema semántico, en el sentido de que las primeras 
palabras que aprenden los niños tienen un papel mucho más importante en la configuración 
de las redes semánticas que las que aprenden a una edad tardía. ¿Por qué las palabras 
aprendidas tempranamente son más importantes? 

Según los modelos localistas, ello se debe a que los primeros conceptos que se aprenden 
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ocupan una posición central en la red semántica y establecen conexiones con todos los que 
se van añadiendo. En cambio, los conceptos que se aprenden tardíamente tienen que unirse a 
la red ya formada, en posiciones más periféricas y con menor número de conexiones. De ahí 
que cuando se produce una lesión cerebral, y como consecuencia los pacientes tienen 
dificultades para recuperar las palabras (anomia), los efectos son más devastadores en las 
palabras de adquisición tardía ya que, al tener menos conexiones, son más vulnerables 
(Cuetos, Monsalve y Pérez, 2005). Igualmente, la pérdida de las palabras que se produce en 
las enfermedades neurodegenerativas, como la demencia de Alzheimer, debido a la atrofia 
cerebral progresiva, comienza afectando primero a las palabras adquiridas a edad tardía. Las 
que se aprendieron tempranamente son más resistentes a la enfermedad (Cuetos, 2003). 

La explicación que proponen los modelos conexionistas es diferente, ya que atribuyen los 
efectos de la edad de adquisición a los diferentes pesos en las conexiones entre los nodos. 
Las palabras que se aprenden tempranamente tienen más posibilidades de aumentar los 
pesos de las conexiones que las que se aprenden tardíamente porque llevan más tiempo 
formando parte de la red y, sobre todo, porque entran a formar parte de la red cuando ésta 
tiene mayor plasticidad. Con el paso del tiempo el sistema neuronal va perdiendo plasticidad 
y, por lo tanto, es más difícil conseguir pesos importantes en las conexiones. Los trastornos 
producidos tanto por lesiones puntuales (anomias) como por enfermedades 
neurodegenerativas (Alzheimer) se explican en estos modelos porque afectan más a las 
conexiones con menores pesos, que son las que corresponden a las palabras aprendidas en 
edades tardías. 

Sea cual fuere la explicación, lo cierto es que la edad y el orden en que cada persona 
aprende las palabras determinan la configuración de su sistema semántico y, 
consecuentemente, si esa persona tiene la desgracia de sufrir la enfermedad de Alzheimer, 
determinan el orden en el que van desapareciendo las palabras de su memoria (Cuetos, 
Rodríguez-Ferreiro, Sage y Ellis, 2012). 


La edad de adquisición parece ser una variable con diferentes puntos de actuación, ya que 
influye en el reconocimiento de las palabras, en el procesamiento semántico e incluso en la 
producción oral. 

Una tercera variable semántica es la imaginabilidad. Por imaginabilidad nos referimos a la 
facilidad con que uno puede imaginar el significado de una palabra. Hay palabras fáciles de 
imaginar, como «cuchillo», «gato» o «libro», y otras en la que es muy difícil producir una 
imagen, como «verdad», «ética» o «maldad». Se ha demostrado que las palabras concretas y 
altamente imaginables se recuerdan mejor que las abstractas y las difícilmente imaginables 
en las pruebas de memoria (Paivio, 1971). Las palabras de alta imaginabilidad se procesan 
más rápidamente que las de baja imaginabilidad (de Groot, 1989). Al igual que la tipicidad, 
la imaginabilidad se mide a través de cuestionarios subjetivos en los que los participantes 
tienen que puntuar sobre una escala, generalmente entre los valores 1 y 7, la facilidad para 
imaginarse el significado de una palabra. Así, palabras, cuyo significado es fácil de imaginar, 
como «árbol», «tijeras», etc., obtienen una puntuación próxima a 7, y palabras que refieren a 
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conceptos difíciles de imaginar, por ejemplo, «dogma», «bondad», etc., obtienen 
puntuaciones próximas a 1. 

Aunque se trata de conceptos diferentes, la imaginabilidad está estrechamente relacionada 
con la variable concreción/abstracción, dado que los objetos concretos son fáciles de 
imaginar y los abstractos difíciles de imaginar. No obstante, no son conceptos exactamente 
iguales, ya que hay objetos abstractos a los que se les ha puesto una imagen; por ejemplo, 
«justicia» es una palabra abstracta, pero solemos imaginarla como una mujer con los ojos 
tapados y una balanza en la mano. 

Un problema con todas estas variables es que, al ser cuantificadas mediante escalas 
subjetivas, pueden ser afectadas por otras variables relacionadas y que los sujetos no pueden 
separar, por ejemplo, la familiaridad o la frecuencia. No obstante, en numerosos estudios, a 
través de análisis estadísticos, se ha puesto de manifiesto la influencia específica de estas 
variables. 


ORGANIZACIÓN DEL SISTEMA SEMÁNTICO 

¿Cómo están organizados los conceptos en nuestro sistema semántico y cómo accedemos a 
ellos cuando comprendemos o producimos las palabras? Sorprende la facilidad y rapidez con 
la que recuperamos los significados de las palabras, a pesar de la gran cantidad de 
información que tenemos en nuestro sistema conceptual. Esto sugiere que el sistema 
conceptual debe estar muy bien organizado, con los conceptos muy accesibles y, al parecer, 
que la forma organizativa es por agrupación en categorías semánticas en función de las 
características comunes. 

Hay categorías muy generales, como las de seres vivos y objetos inanimados, y otras más 
específicas, como la de reptiles, frutas o herramientas. Por otra parte, existen jerarquías 
dentro de las categorías, ya que las más pequeñas forman parte de otras más generales. La 
categoría «aves» constituida por muchos ejemplares diferentes, forma parte de la categoría 
más general de «animales», en la que se incluyen también los peces, los mamíferos, los 
reptiles, etc., y, a su vez, la categoría de animales junto con los vegetales forma parte de la 
categoría «seres vivos». 

Cada concepto es una abstracción de muchos estímulos concretos. Así, el concepto «gato» se 
refiere a todos los gatos del mundo, con independencia de su tamaño, forma o color. Existen 
muchos tipos de sillas diferentes, algunas clásicas, otras con diseños vanguardistas, algunas 
de madera, otras de hierro, de plástico, etc., y en todos los colores posibles. Pero todas las 
agrupamos bajo el concepto de «silla». Este agrupa-miento supone un ahorro enorme en 
términos cognitivos, pues no tenemos que formar una representación para Cada ejemplar 
concreto de la categoría, lo que implicaría cientos de representaciones de sillas, de mesas, de 
gatos, etc. Por otra parte, cuando nos encontramos un nuevo ejemplar, por ejemplo una silla 
diferente, no tendremos problemas para saber de qué se trata, aunque no lo hayamos visto 
antes. 
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Estas categorías, formadas por abstracción de muchos ejemplares diferentes pertenecen al 
denominado nivel básico, porque es el nivel en el que generalmente pensamos y al que nos 
referimos constantemente. Excepto que se desee especificar cierta información, solemos 
hablar del perro, el gato, el árbol o la mesa, sin referirnos a una raza concreta de perro, a un 
árbol específico o a un tipo de mesa determinado. Eleanor Rosch (1978) afirmaba que el 
nivel básico es de gran relevancia para la organización de los conceptos en nuestra memoria, 
pues agrupa conceptos específicos con características comunes (todos los perros, con 
independencia de la raza, tienen un gran parecido, todas las mesas tienen mucho en común, 
etc.) y se diferencian claramente de los otros conceptos básicos (cualquier perro se diferencia 
de gatos, caballos o vacas, y cualquier mesa se diferencia de las sillas o los armarios). De 
hecho, es el tipo de categoría más utilizado en nuestras conversaciones, y los conceptos 
básicos son los primeros que adquieren los niños durante el desarrollo del lenguaje. 

También disponemos de otras categorías superiores e inferiores al nivel básico que son de 
gran utilidad. Por el lado inferior está el nivel subordinado, que permite especificar los 
ejemplares concretos de la categoría (muy útiles para los especialistas de un campo 
determinado). Así, dentro de la categoría «mesa» distinguimos muchos tipos de mesa: mesa 
de cocina, mesa de comedor, mesa de sillón, mesa de estudio, etc., cada una con sus 
características determinadas, y dentro de la categoría «árbol» distinguimos el abeto, el roble, 
el sauce, el cerezo, etcétera. 

Por arriba, exigiendo mayor abstracción, está el nivel supraordenado, al que pertenecen las 
categorías más generales y abstractas, por ejemplo, animales, muebles o vegetales. Las 
categorías supraordenadas están formadas por ejemplares muy diversos que muchas veces 
poco tienen en común entre sí, por lo que exige un gran ejercicio de abstracción, ¿qué tienen 
en común la mesa, el armario, la cama, etc., para formar la categoría muebles? o ¿el perro, el 
pulpo, la sardina y la mariposa para formar la categoría animales? No obstante, este nivel 
supone también un gran ahorro cognitivo, pues permite referirse a todos los animales o a 
todos los muebles con una sola palabra. 

Algunas categorías son cerradas, como los días de la semana o los meses del año, mientras 
que otras -la mayoría- son relativamente abiertas y están constituidas por muchos miembros, 
especialmente las categorías naturales (animales, flores, etc.), y muchas artificiales (muebles, 
herramientas, etc.). 

Por otra parte, nuestros conocimientos conceptuales son bastante similares a los de las per- 
sonas de nuestro entorno. A diferencia de lo que ocurre con los conocimientos episódicos, 
que son muy diferentes en cada persona, puesto que cada uno tiene sus propias experiencias, 
el conocimiento semántico es compartido mayoritaria-mente por todos los miembros de la 
sociedad en la que vivimos. Este conocimiento incluye toda la información sobre los objetos, 
personas, hechos, etc., de nuestro mundo. Sabemos que las jirafas tienen el cuello largo, son 
mamíferos, viven en la sabana, se alimentan de las ramas de los árboles, etc., que Dublín es 
la capital de Irlanda o que Alejandro Magno fue un general famoso. 
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Cada vez que aprendemos un nuevo concepto, no sólo aprendemos sus características 
esenciales, sino también la categoría a la que pertenece, que es lo más importante. De esta 
manera, colocamos ese concepto en el sitio adecuado de nuestro sistema conceptual, lo que 
facilita su búsqueda y determina que ese sistema disponga de cierta organización. Asimismo, 
en el momento en que lo clasificamos en una categoría, le asignamos todas las características 
de esa categoría. En el momento en que conocemos un nuevo tipo de pájaro le incorporamos 
automáticamente todos los rasgos de la categoría «pájaros» (tiene pico y plumas, pone 
huevos, hace nidos, vuela, etc.). Si no cumpliese alguno de esos rasgos, por ejemplo, si no 
volase, lo incluiríamos como rasgo característico. 

Aunque cada categoría está formada por un número determinado de ejemplares, no todos los 
ejemplares de una categoría son igualmente típicos o característicos de ella. Consideramos a 
un «gorrión» o a un «águila» ejemplos más típicos de ave que un «pingiiino» o un 
«avestruz»; un «perro» como ejemplo más típico de animal que una «babosa»; una «rosa» 
como ejemplo más representativo de flor que un «lirio». Si a un grupo de personas les 
pedimos que digan o escriban todos los animales que se les ocurra, la gran mayoría empieza 
por la palabra «perro», seguida de otras como «gato», «vaca», «león», etc. Muy pocos 
empezarían por «lechuza», «cangrejo» o «erizo», aunque son tan animales como los 
primeros. Por consiguiente, los distintos elementos de una categoría difieren en el nivel de 
tipicidad de dicha categoría. Esta variable se refiere al grado en que un concepto es 
representativo de una categoría dada. Puede medirse a través de escalas subjetivas de tipici- 
dad, pidiendo a un grupo de participantes que estimen el grado de tipicidad de cada palabra, 
o también a través de tareas de fluidez verbal, en las que tienen que decir o escribir, durante 
un tiempo determinado, todos los ejemplares que se les ocurra de una de las categorías que 
se les indica. 

Dado el papel tan importante de la tipicidad/disponibilidad en el procesamiento semántico, 
es fundamental disponer de estudios normativos acerca de lo que las personas de un ámbito 
lingúístico y cultural consideran como miembros de una categoría semántica y cuáles son 
más representativos de ésta. En inglés, uno de los primeros trabajos fue el de Battig y 
Montague (1969) sobre categorías naturales, estudiadas en un conjunto de 422 estudiantes de 
las universidades de Maryland e Illinois a los que se les pidió que escribiesen ejemplares de 
un buen número de categorías 

En España, además de las normas de lzuera et al. mencionadas anteriormente, disponemos 
del trabajo de Pilar Soto y colaboradores, inicial-mente publicado por la Universidad 
Autónoma de Madrid y reeditado luego por la editorial Visor (Soto et al., 1994). Este estudio 
normativo se centra en 45 categorías naturales extraídas de Battig y Montague, como 
accidentes geográficos, animales, árboles, aves, edificios, enfermedades, fenómenos 
atmosféricos, flores, frutas, herramientas, insectos, instrumentos musicales, mamíferos, 
mariscos, material, metales, muebles, partes de una vivienda, partes del cuerpo humano, 
peces, piedras preciosas, prendas de vestir, razas de perros, reptiles, entre otras. 
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Más recientemente, Marful, Diez y Fernández (2014) recogieron datos de 284 participantes 
para las 56 categorías de Batting y Montague. 

Psicólogos cognitivos y psicolingilistas se han puesto de acuerdo para organizar los signi- 
ficados de las palabras en términos que puedan ser manejables con programas diseñados para 
procesar el lenguaje natural, dentro de las enormes limitaciones que todavía existen en este 
campo. WordNet es uno de los ejemplos más notables de ello. Se trata de una base 
electrónica de palabras creada inicialmente por Fellbaum (1998) y bajo la dirección de 
George A. Miller en la Universidad de Princeton. 


TEORÍAS COGNITIVAS 
Desde la psicología cognitiva se han propuesto diversas explicaciones sobre cómo 
manejamos y representamos los significados en nuestra mente. Tres son los principales 
enfoques o teorías al respecto: de redes, de rasgos y de prototipos. 

e Teorías de redes 
Una de las ideas más influyentes sobre la organización de los conceptos es que el significado 
de una palabra forma parte de una especie de red de significados interconectados. Desde la 
psicología cognitiva y el paradigma del procesamiento de información, las primeras 
formulaciones sobre el significado se basaron en la metáfora del ordenador. El modelo 
jerárquico de Collins y Quillian (1969) planteaba una representación del conocimiento 
análoga a la que podría existir en una computadora, respondiendo al principio de economía 
cognitiva. Los conceptos serían nodos de la red conectados entre sí en distintos niveles 
jerárquicos. En los niveles más bajos de la red se encuentran los conceptos más específicos 
y, a medida que se asciende, los conceptos son cada vez más abstractos. Como puede verse 
en la figura 7-1, en la parte baja de la red están los ejemplares específicos (canario, paloma, 
avestruz, salmón, etc.), en un nivel superior, categorías más generales (aves, peces, reptiles, 
etc.), y en otro nivel superior, categorías aun más abstractas (animales, vegetales, etc.). De 
este modo, cada concepto se encuentra conectado a su categoría y, a través de ésta, a otra 
categoría superior. 


come 


respira tiene piel 
pone huevos 


tiene a. Y «e-: escamas 
puede Y «-: en el agua 


es alto 
CANARIO TIBURÓN 


canta es amarillo no puede volar es peligroso es comestible es rosa 


La 


Figura 7-1. Modelo de red jerárquica de Collins y Quillian (1969). 


Por otra parte, cada nodo tiene asociadas las propiedades que le corresponden a su nivel 
dentro de la jerarquía. Partiendo de la idea de que tanto un ordenador como una mente tienen 
un espacio limitado para almacenar información, con este modelo se evitaba la redundancia 
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de información semántica. Así, la propiedad «tener alas» está vinculada sólo al nodo más 
alto posible, el de «ave», puesto que todos los ejemplares de esa categoría poseen esa 
propiedad, ahorrando así su duplicación en cada uno de los nodos inferiores. Ya no es 
necesario especificar que el gorrión, el águila o el avestruz tienen alas porque ya está 
especificado en la categoría superior «aves». Asimismo, tampoco es necesario especificar 
para Cada uno de esos ejemplares que tienen piel, que respiran o comen, porque esas 
propiedades ya están incluidas en la categoría superior «animales». 
Para poner a prueba su modelo, Collins y Quillian realizaron una serie de experimentos 
basados en la tarea de verificación de oraciones. En unos ensayos, a los participantes se les 
presentaba frases sobre la pertenencia a una categoría y debían responder lo más rápidamente 
posible pulsando uno de dos botones, uno si la frase era verdadera, y otro si era falsa: 

Un canario es un canario. 

Un canario es un ave. 

Un canario es un animal. 

Un canario es un pez. 
Las tres primeras son ciertas y la última es falsa. La primera es obvia y requiere poco tiempo 
para dar una respuesta positiva. La segunda necesitaría más tiempo, la tercera más tiempo 
aun, y la cuarta, que es falsa, más tiempo todavía. Según los autores, los participantes 
comienzan en la red por el nodo que corresponde al estímulo presentado (canario) y viajan 
hacia arriba hasta encontrar el nivel que contiene la información adecuada. Cuando la 
categoría es animal, el recorrido es mayor que cuando es ave y, por lo tanto, los tiempos 
también son mayores. A mayor distancia semántica entre el concepto y la categoría, mayor el 
tiempo que se tarda en verificar la frase. Cuando la frase es falsa, el participante recorre toda 
la red hacia arriba y no encuentra el concepto, por lo que decide que es falsa. 
En otros ensayos se preguntaba sobre las propiedades de los conceptos, y los participantes 
también tenían que responder si la frase era verdadera o falsa. En unos casos las propiedades 
pertenecían al propio concepto, y en otros, a conceptos de niveles superiores, como reflejan 
los siguientes ejemplos: 

El canario puede cantar. 

El canario puede volar. 

El canario tiene piel. 

El canario tiene escamas. 

r La primera requerirá menos tiempo porque se trata de una 


característica directamente ligada al concepto canario; la segunda 
requerirá más tiempo porque es necesario subir hasta el concepto 
ave y desde ahí a sus características, y la tercera más tiempo aun 
porque hay que subir al concepto ave, desde ahí al de animal y 
finalmente a sus características. 


Efectivamente, los datos parecen ajustarse a lo predicho por el 
igura 7-2. Tiempos de reacción en milisegundos en 
a ' modelo, pues cuantos más nodos hay que recorrer, más tiempo se 


na tarea de verificación de oraciones de Collins 
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tarda en dar la respuesta, como puede verse en la figura 7-2, donde se muestran los tiempos 
de reacción en un experimento de Collins y Quillian (1969). Por otra parte, en esta figura se 
comprueba que las oraciones referidas a las propiedades de los conceptos consumen más 
tiempo que las que tratan sobre la pertenencia a las categorías 
Limitaciones del modelo 
Aunque el modelo explicaba perfectamente esos primeros resultados, pronto aparecieron 
algunos problemas para los que el modelo no tenía respuesta. En primer lugar, no todos los 
conceptos se pueden organizar en un esquema jerárquico tan claro como el que se ha 
descrito. Con las categorías naturales como los animales o los vegetales las cosas parecen 
funcionar, pero con otras categorías no siempre es tan fácil establecer esas jerarquías. 
Especialmente resulta difícil con los conceptos abstractos. ¿Cómo podemos organizar 
conceptos como «dogma», «verdad» o «fe»? ¿Cuáles de estos conceptos están en los niveles 
bajos de la red y cuáles en los niveles altos? ¿Cómo se relacionan entre sí? El modelo no 
tiene realmente explicación para estos conceptos. 
Además, algunos datos de experimentos posteriores no encajaban en las predicciones del 
modelo. Así, según éste, se tardaría más tiempo en responder a la oración «Una vaca es un 
animal» que a la oración «Una vaca es un mamífero» porque la primera requiere ascender 
dos nodos (de vaca a mamífero y de mamífero a animal) y la segunda sólo uno (de vaca a 
mamífero). Sin embargo, sucede justo lo contrario: la primera se verifica mucho más 
rápidamente que la segunda (Rips, Shoben y Smith, 1973), lo que indica que la memoria no 
refleja necesariamente la estructura lógica de las categorías naturales. 
Tampoco encajan las respuestas de pertenencia de los ejemplares de una misma categoría. 
Dado que se asume que los nodos de un mismo nivel jerárquico son más o menos 
equivalentes, los nodos «gorrión» y «pingúino», situados ambos un nivel por debajo del 
nodo «ave», deberían requerir tiempos parecidos en la verificación de frases: 

Un gorrión es un ave. 

Un pingúino es un ave. 
Sin embargo, no ocurre así: los tiempos de respuesta para gorrión son más cortos que para 
pingiiino (Rips, Shoben y Smith, 1973). La explicación radica en que gorrión es un ejemplar 
más típico o representativo de la categoría «aves» que pingúino. 
Ni siquiera encajan los resultados de las oraciones falsas. Según el modelo, las respuestas 
negativas ante las frases falsas deberían arrojar tiempos parecidos para un mismo concepto: 
en todos los casos, el participante ascendería a los nodos superiores y, al no encontrar 
ninguno con la información buscada, daría una respuesta negativa. Pero tampoco ocurre así, 
dado que la misma palabra o concepto da lugar a latencias distintas: 

Un pino es una iglesia. 

Un pino es una flor. 
La primera frase es rechazada con más celeridad que la segunda (Wilkins, 1971), pues 
cuanto más relacionados estén dos objetos, más difícil es tomar la decisión de que la oración 
es falsa y los tiempos de respuesta son mayores. 
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Red de propagación de activación 
Todos los problemas señalados obligaron a introducir importantes modificaciones en el 


esquema de red jerárquica. Collins y Loftus (1975) plantearon un nuevo modelo, basado en 
la propagación de la activación (Fig. 7-3), que asume que la información semántica también 
está organizada en nodos interconectados, pero no de forma jerárquica. Se trata de un 
esquema más flexible. 


DICTE 


AS 
E 
EY 
Fuego 


Puesta 
de sol 
rm 


Figura 7-3. Modelo de propagación de activación de Collins y Loftus (1975). 

Los conceptos que están asociados entre sí (p. ej., fuego y rojo) se hallan más próximos 
dentro de la red y están unidos por un vínculo. Cuanto más fuerte es la asociación, más 
cercanos están y más corto es el enlace que los une. Cuando un concepto se activa, su 
activación se propaga a través de los otros nodos, de donde deriva el nombre del modelo. Si 
dos nodos están lejanos, la activación llega más débil que si están cercanos. Los nodos con 
una fuerte relación forman clusters o conglomerados que representarían campos semánticos 
(flores, colores, etc.) u otras informaciones estrechamente asociadas (cuna-bebé, etc.). 

Este mecanismo de propagación de activación explicaría los resultados obtenidos en los 
experimentos de verificación de oraciones. «Un canario tiene plumas» se verificaría antes 


que «un canario tiene piel» porque el nodo «canario» estaría más próximo al nodo «plumas» 
que al nodo «piel» y, en consecuencia, recibiría más activación de canario. El mismo 
mecanismo daría cuenta del efecto de tipicidad. el nodo «gorrión» está más cerca que 
«pingúino» del nodo «ave». El modelo también explica el hecho de que las respuestas falsas 
puedan presentar latencias diferentes. La frase «el pino es una iglesia» se rechaza antes que 
«el pino es una flor» porque el nodo «flor», aunque lejano, está más próximo a «pino» que 
«iglesia» y, por lo tanto, recibirá alguna activación, muy débil, de pino. 

El lector comprobará que este modelo recuerda bastante al del logogén de Morton, en 
relación con el acceso léxico. Sin embargo, no hay que perder de vista que el modelo de 
Collins y Loftus trata exclusivamente de los significados o conceptos; nada dice acerca de 
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otros tipos de información léxica (fonológica, ortográfica, morfosintáctica) ni cuáles son los 
mecanismos de acceso. Un modelo como éste tiene gran capacidad explicativa; puede dar 
cuenta de una extensa gama de hallazgos empíricos. Pero su propia generalidad es, al mismo 
tiempo, su principal limitación: es un modelo difícil de poner a prueba. Cuesta imaginar qué 
clase de experimentos podrían falsearlo (Harley, 2008) y así marcar sus límites, que es la 
forma en que se avanza en la ciencia. Al ser tan amplio, sus predicciones son también vagas. 
En cualquier caso, la noción de propagación de activación ha ejercido una fuerte influencia y 
es un mecanismo incorporado a la mayor parte de los planteamientos teóricos 
contemporáneos. 

e Teorías de rasgos 
El concepto «cana» puede descomponerse en los conceptos «pelo» + «blanco». Las teorías 
composicionales consideran que todos los conceptos están compuestos por un conjunto de 
primitivos semánticos o rasgos simples que ya no se pueden subdividir en otros. Estos 
modelos, cuya primera formulación se debe a Katz y Fodor (1963), defienden que los 
conceptos están representados en nuestra memoria como listas o agregados de rasgos 
semánticos. Una aproximación teórica más reciente es la del modelo de rasgos 
probabilísticos de Smith y Medin (1981). 
En su origen, la teoría de rasgos tuvo una relación estrecha con los intentos de la inteligencia 
artificial por conseguir sistemas artificiales que «comprendieran» el lenguaje. Roger Schank 
diseñó uno de los programas de ordenador más influyentes en este terreno; en él todos los 
verbos se descomponían en un conjunto de 12 acciones primitivas (p. ej., expeler, agarrar, 
ingerir, mover, hablar, etc.), de cuya combinación surgían todos los demás (Schank, 1972). 
El modelo de rasgos más conocido es, sin duda, el formulado por Rips, Shoben y Smith 
(1973) y Smith, Shoben y Rips (1974). Según este modelo, los conceptos se representan en la 
memoria por medio de conjuntos de rasgos semánticos. Así, el concepto «canario» estaría 
representado por los rasgos tener plumas, poner huevos, volar, ser bípedo, tener color 
amarillo, etc., el concepto «ave» por los rasgos ser bípedo, tener plumas, poner huevos, etc. 
Y los resultados de los experimentos de verificación de frases se explicarían, según este 
modelo, porque se produce una comparación entre el ejemplar y su categoría y, cuantos más 
rasgos se solapan entre ambos, más rápida es la respuesta. Así, respondemos más rápido a la 
oración «el canario es un ave» que a la oración «el pato es un ave» porque canario y ave 
comparten más rasgos que pato y ave. 
En esta teoría se contemplan dos tipos de rasgos: a) rasgos definitorios, que son claves para 
formar parte de una categoría semántica, y b) rasgos característicos, que añaden propiedades 
a los conceptos representados. De esta manera, aunque los ejemplares, jilguero, gorrión, 
pollo y avestruz, pertenecen, todos ellos, a la categoría «aves», los dos primeros están más 
relacionados porque comparten tanto los rasgos definitorios como los característicos, 
mientras que los dos últimos sólo comparten los definitorios (tener plumas, poner huevos,) 
pero no los característicos (volar, anidar en los árboles, etc.). Hay, en cambio, otros 
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ejemplares que poseen algunos rasgos característicos (p. ej., el murciélago, la mariposa, etc.), 
pero no poseen los definitorios y, por lo tanto, no pertenecen a la categoría. 

Según este modelo de Smith et al. (1974), la existencia de estos dos tipos de rasgos implica 
que la verificación de oraciones se realice en dos estadios. En el primer estadio se recuperan 
tanto los rasgos definitorios como los característicos del ejemplar y de la categoría y se hace 
una comparación global entre ambos. Si existen muchos rasgos en común, esto es, si existe 
un gran solapamiento, respondemos rápidamente que sí, que ese ejemplar pertenece a la 
categoría. Por ejemplo, en la frase «un gorrión es un ave». Si, por el contrario, son pocos los 
rasgos compartidos, se niega la relación con rapidez. En la frase «un gorrión es un mueble» 
apenas existe solapamiento y la respuesta negativa es muy rápida. En ambos casos podemos 
dar la respuesta de verdadero o falso sin pasar por el segundo estadio (Fig. 7-4). 


Frase estímulo 
(p. ej., «el pingúino es ave») 


| 


Bajo solapamiento Estadio 1 Alto solapamiento 
X<Co Se comparan todos los rasgos (definitorios x>C 
y característicos) entre el ejemplar y la categoría 


X = grado de solapamiento o similitud 


Solapamiento intermedio 
Co <X< Ci 


No coinciden Estadio 2 Coinciden 


| Se comparan sólo los rasgos definitorios | 


Respuesta: «Falso» Respuesta: «Verdad» 


Figura 7-4. Modelo de comparación de rasgos de Smith, Shoben y Rips (1974). C, significa el criterio o valor 

que distingue entre bajo y moderado solapamiento de rasgos. C, es el criterio que distingue entre solapamiento 

moderado y alto de rasgos. 
Pero cuando el ejemplar y la categoría comparten un número intermedio de rasgos (p. ej., en 
estos casos «un pingiiino es un ave» o «un murciélago es un ave») entonces es necesario 
pasar por el segundo estadio. En este segundo estadio se comparan únicamente los rasgos 
definitorios de ambos conceptos, y cuando todos esos rasgos coinciden, la respuesta es 
«verdadero», pero cuando alguno de los rasgos no coincide, la respuesta es «falso». En 
consecuencia, en las frases verdaderas, cuantos más rasgos compartan los ejemplares con la 
categoría, más rápido se produce la respuesta; en cambio en las frases falsas, la mayor 
similitud entre los dos conceptos implicará tiempos mayores. 
Limitaciones del modelo. Las limitaciones de este modelo tienen varios orígenes. En primer 
lugar, no está claro que todos los conceptos puedan descomponerse en un listado de rasgos 
simples. Muchas categorías no reúnen un conjunto de rasgos que posean todos los miembros 
de esa categoría. El ejemplo más conocido es el de Wittgenstein (1953) respecto al «juego». 
¿Qué tienen todos los juegos en común? No es posible encontrar una lista de rasgos que 
definan el concepto de juego. En su lugar, es posible agrupar familias de juegos por 
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características comunes, pero no se consigue un listado único común a todos los juegos. Si 
tomamos, por ejemplo, los juegos fútbol, tenis, ajedrez, poker, escondite, etc., podemos ver 
que tienen ciertos rasgos comunes (p. ej., algunos utilizan pelota, algunos son de mesa, 
algunos implican correr, etc.), pero ninguno los tiene todos. 
Por otra parte, la teoría de rasgos presupone que existen límites nítidos entre las categorías 
semánticas, pero en la práctica los seres humanos funcionamos con límites difusos. Para 
mucha gente no está claro si un tomate es una fruta o una verdura. No hay un límite claro 
entre una «taza» y un «bol»: diversos objetos físicos se sitúan a lo largo de un continuo entre 
ambos conceptos, y diferentes participantes pueden categorizarlos de formas distintas. 
McCloskey y Glucksberg (1978) demostraron que, aunque las personas coinciden en muchos 
conceptos, existen muchos otros sobre los que no hay acuerdo y cuyos límites son borrosos 
(p. ej., sólo la mitad de los participantes estaba de acuerdo en considerar una calabaza como 
un tipo de fruta, mientras que la otra mitad, no). 
Más aun, como esta teoría trabaja con listas de rasgos independientes, no captura nuestro 
conocimiento sobre cómo se relacionan entre sí las propiedades de los objetos. Así, dentro de 
la categoría de ave, los rasgos «pequeño» y «canta» se correlacionan mucho entre sí y los 
seres humanos conocemos esta correlación, pero esto no aparece reflejado en el modelo 
(Reeves, Hirsh-Pasek y Golinkoff, 1999). 

e Teoría de prototipos 
Como alternativa a la teoría de rasgos surgió la denominada teoría de los prototipos, de la 
mano principalmente de Eleanor Rosch (1973). Como se ha mencionado, una de las 
principales dificultades de las teorías composicionales es que, en contra de lo que puede 
parecer en un principio, es sorprendentemente difícil hacer una lista de rasgos o propiedades 
que estén presentes en todos los miembros de una categoría semántica. Rosch y Mervis 
(1975) presentaron a un grupo de voluntarios ejemplos de distintas categorías, como frutas 
(manzana, pera, uva, ciruelas, etc.), muebles (mesa, silla, librería, aparador, sofá, etc.), aves 
(gorrión, petirrojo, flamenco, águila, etc.), vehículos (coche, camión, moto, etc.), entre otras, 
y les pidieron que hicieran una lista de rasgos para cada ejemplo particular. Curiosamente, 
apenas aparecían rasgos comunes a todos los miembros de una categoría, y aquellos que sí lo 
eran, no eran diferenciadores de esa categoría frente a otras (p. ej., el rasgo «estar vivo» en la 
categoría de aves). 
La teoría de los prototipos se basa en un enfoque distinto al de los rasgos: los objetos se 
agrupan por su semejanza familiar entre ellos; es decir, las categorías estarían definidas por 
el parecido entre sus miembros, y no por una definición lógica y objetiva que incluye o 
excluye los miembros de forma discreta (un objeto está claramente dentro y otro está 
claramente fuera). En lugar de considerar rasgos definitorios, que deben cumplir 
absolutamente todos los miembros de una categoría, Rosch habla de rasgos característicos de 
la categoría, o atributos típicos y comunes a muchos miembros de dicha categoría, aunque no 
necesariamente a todos (p. ej., «tener plumas», «volar», para las aves). Un prototipo sería 
una representación abstracta o el miembro ideal de esa categoría, una especie de promedio de 
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todos sus miembros y, en cierto modo, constituiría «el mejor ejemplo» de la categoría. De 
esta concepción se desprenden dos propiedades fundamentales: la estructura graduada y los 
límites difusos de las categorías. 

Estructura graduada. No todos los miembros son igualmente representativos de la ca- 
tegoría; éstos varían en su grado de tipicidad o prototipicidad: un gorrión o un jilguero son 
más representativos de la categoría «ave» que un pingúino o un avestruz, porque poseen más 
rasgos característicos (pueden volar, etc.) y estarían más próximos a lo que sería el prototipo 
ideal de un ave. Un perro sería un ejemplo de «mamífero» más típico que un murciélago o un 
ornitorrinco. Una categoría puede representarse espacialmente (Fig. 7-5) como un continuo 
donde se sitúan los distintos miembros o ejemplares 
dependiendo de su tipicidad: cuanto más típicos O 
cercanos fueran a un prototipo ideal, más se acercarían 
a una posición central. Aquellos que son atípicos y 
pla poco característicos se situarían en posiciones más 
dl periféricas. Una consecuencia de esto es que los 
ejemplares más prototípicos o centrales comparten más 
rasgos entre sí que los periféricos. El funcionamiento de 
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Figura 7-5. Teoría de prototipos. Cuanto más típico o 


representativo de la categoría saves» es un miembro, la mente no corresponde exactamente a la lógica 

eos recrecemativos ocupan comes Objetiva de las cosas. Incluso en una categoría 

di rígidamente definida como los números impares las 
personas consideran «más impar», por ejemplo, al número 13 que al 57. O «madre» se 
considera mejor ejemplo de «mujer» que «camarera» (cuando en buena lógica tan mujer es 
una madre como una camarera) (Armstrong, Gleitman y Gleitman, 1983). 
Límites difusos. Como consecuencia de esta estructura graduada, el grado de pertenencia se 
va difuminando a medida que el ejemplar se aleja del centro, y las fronteras entre conceptos 
próximos llegan a ser difusas. Parece que los seres humanos no manejamos significados o 
conceptos con límites nítidos, que respondan a una definición cuasimatemática («mueble es 
todo objeto que tiene las propiedades siguientes:...»), sino que, más bien, nos basamos en 
conceptos con fronteras difusas o borrosas entre ellos (Lakoff, 1987). 

La teoría de los prototipos ha reunido importante evidencia empírica a su favor. En general, 
los miembros más prototípicos presentan ventajas en su procesamiento. Los experimentos 
con verificación de frases arrojan tiempos que reflejan la estructura graduada de las 
categorías: cuánto más central o típico es un ejemplar, menos tiempo tardan los participantes 
en dar una respuesta. Los sujetos harían comparaciones entre el ejemplar y el prototipo 
abstracto, y en la medida en que ambos estuvieran próximos, la decisión sería más rápida. 
Además, las palabras que representan objetos más típicos se recuerdan mejor en las pruebas 
de memoria (Kail y Nippold, 1984). 
Limitaciones del modelo. Esta teoría tiene algunas limitaciones. No todos los conceptos 
parecen ajustarse bien a este esquema de prototipos; por ejemplo, ¿cuál es el prototipo para 
«verdad»? Por otra parte, los juicios de tipicidad no son fijos sino que varían 
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sistemáticamente según el contexto. Un miembro considerado altamente prototípico en un 
contexto, puede no serlo en un contexto distinto. Para Barsalou (1985), la estructura 
graduada de una categoría no revela propiedades invariantes asociadas a ella, sino que refleja 
la habilidad dinámica de la gente para construir conceptos en situaciones diversas. De hecho, 
las personas construyen categorías ad hoc orientadas a una meta, como, por ejemplo, la 
categoría de «cosas usadas para vender» o la de «objetos que te llevarías a un camping» o la 
de «comidas bajas en calorías»; aunque no corresponden a representaciones bien establecidas 
en la memoria, cuentan también con una estructura interna graduada y en ellas unos 
miembros son más típicos que otros. Finalmente, algunos autores señalan que se puede 
incurrir en circularidad: los ejemplares son miembros de una categoría porque son similares, 
y son similares porque son miembros de una categoría. Es decir, se necesitaría información 
independiente, más allá de los juicios subjetivos, para explicar por qué los miembros de una 
categoría son similares, y la teoría de los prototipos no parece proporcionarla. 

La teoría de los prototipos parte del principio de que el prototipo es una abstracción o 
miembro ideal de la categoría. Recientemente se ha cuestionado si esta abstracción es un 
componente esencial en la representación de los conceptos. Una variante posterior, conocida 
como teoría basada en ejemplares (Komatsu, 1992), no defiende la existencia de un prototipo 
abstracto, sino que éste estaría encarnado por ejemplares concretos que ocupan posiciones 
centrales en el espacio prototípico. De esta manera, los juicios de verificación no se basarían 
en comparaciones con prototipos abstractos, sino con ejemplares centrales. 


TEORÍAS NEUROCOGNITIVAS 

Las teorías cognitivas explicadas en el apartado anterior no se preocupaban por el 
componente neurológico que subyace a toda actividad cognitiva. En los últimos años, sin 
embargo, se ha tenido muy en cuenta el sustrato neurológico de los conceptos a la hora de 
formular las teorías del procesamiento semántico. Los datos aportados por los estudios de 
neuroimagen y, fundamentalmente, de pacientes con lesiones cerebrales, permiten elaborar 
teorías que den explicaciones tanto a nivel cognitivo como neurológico del sistema 
conceptual. A principios de los años ochenta, Elizabeth Warrington y sus colaboradores 
publicaron varios casos de pacientes que, como consecuencia de haber sufrido una lesión 
cerebral, mostraban dificultades específicas con determinadas categorías semánticas. 
Algunos pacientes tenían graves dificultades para procesar conceptos pertenecientes a la 
categoría de seres vivos (Warrington y Shallice, 1984), y otros para procesar objetos 
inanimados (Warrington y McCarthy, 1983). Estudios posteriores describieron pacientes con 
trastornos para categorías más específicas: algunos con dificultades sólo para la categoría 
animales, otros sólo para la categoría de frutas y verduras, otros para los artefactos. Incluso 
se han descrito trastornos para categorías muy específicas, como piedras preciosas, 
instrumentos musicales, metales o partes del cuerpo. No obstante, en estos últimos casos 
existen dudas de si los estímulos entre las diferentes categorías estaban bien emparejados. 
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Ciertamente, en los primeros estudios realizados sobre disociaciones entre categorías no se 
tuvieron muy en cuenta las características psicolingiísticas de los estímulos, y las 
dificultades que presentaban los pacientes con una determinada categoría podían haber sido 
debidas a la frecuencia o familiaridad de los estímulos más que a la propia categoría. Por 
ejemplo, la categoría «piedras preciosas» o la de «metales» están formadas por ejemplares de 
baja frecuencia y baja familiaridad. Incluso la dificultad que algunos pacientes tienen con la 
categoría «seres vivos» podría estar causada porque sus componentes son de más baja 
frecuencia y familiaridad (excepto unos pocos como el perro, el gato, etc.) y de mayor 
complejidad visual que los objetos inanimados. Stewart et al. (1992) presentaron el caso de 
un paciente que tenía más dificultades con la categoría «seres vivos» que con la de «objetos 
inanimados». Sin embargo, cuando se igualaron los ítems de las dos categorías en frecuencia, 
familiaridad y complejidad visual, las diferencias entre las categorías desaparecieron. No 
obstante, los estudios posteriores fueron más cuidadosos en el emparejamiento de los 
estímulos y siguieron encontrándose disociaciones entre las diferentes categorías semánticas, 
especialmente las grandes categorías (animales, frutas y verduras, objetos inanimados, etc.). 
Los datos de los pacientes con trastornos en determinadas categorías semánticas han servido 
para entender mejor cómo están organizados los conceptos en nuestro sistema semántico, 
-pues parece claro que se agrupan por categorías- e incluso para conocer las áreas del cerebro 
responsables del procesamiento semántico. El hecho de que se hayan encontrado 
disociaciones entre determinadas categorías semánticas, especialmente entre las categorías 
generales de seres vivos y objetos inanimados, pero también entre categorías más específicas 
como animales, frutas y verduras, instrumentos musicales, partes del cuerpo, etc., lleva a 
suponer que las distintas categorías semánticas se hallan representadas por redes neuronales 
en diferentes áreas cerebrales. De esta manera, los animales estarían representados en una 
zona concreta del cerebro y, si se produjese una lesión en esa zona, el paciente tendría 
dificultades para procesar animales; los objetos inanimados estarían representados en otra 
zona también susceptible de ser lesionada, y así con las demás categorías. 
No obstante, existen otras teorías diferentes, ya que ciertos datos son difíciles de encajar con 
esta explicación. Uno de los datos difíciles de explicar es el hecho de que la categoría 
específica de instrumentos musicales suele ir asociada con la categoría general de seres vivos 
en lugar de ir con objetos inanimados. Es decir, muchos pacientes con dificultades para 
procesar los instrumentos musicales también tienen dificultades con los seres vivos y no las 
tienen con los objetos inanimados como debería corresponder. Por el contrario, la categoría 
específica de partes del cuerpo suele ir asociada con la categoría general de objetos 
inanimados en lugar de con los seres vivos. Veamos cómo explican estos resultados las 
principales teorías neurocognitivas. 

e Teoría sensoriofuncional 
La primera teoría planteada -y la más conocida- para explicar las disociaciones encontradas 
en los pacientes con trastornos en ciertas categorías semánticas es la denominada 
sensoriofuncional, propuesta por Warrington y Mc-Carthy (1987) y Warrington y Shallice 
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(1984). Según esta teoría, no existe una separación de categorías semánticas en el cerebro, 
sino que los conceptos están representados en él en función de sus rasgos característicos, y 
así, los seres vivos se distinguen fundamentalmente por sus rasgos perceptivos (las cebras 
por las rayas, los canarios por el color amarillo, etc.), mientras que los objetos inanimados se 
distinguen por sus propiedades funcionales (el serrucho por sus picos para cortar, el martillo 
por su forma para ser agarrado con la mano para golpear, etc.). En consecuencia, las redes 
neuronales responsables de los seres vivos se extenderán más hacia las zonas perceptivas 
(zona temporooccipital), mientras que las responsables de los objetos inanimados se 
extenderán por la zona motora (frontoparietal). Así, pues, una lesión en la zona 
temporooccipital dañará más los rasgos perceptivos y, por lo tanto, afectará más a los seres 
vivos y a los instrumentos musicales, que también se distinguen por sus características 
perceptivas. En cambio, una lesión en la zona frontoparietal afectará más a los rasgos 
funcionales y, consecuentemente, a los objetos inanimados, pero también a las partes del 
cuerpo, especialmente brazos, manos, piernas, etc., que se relacionan físicamente con sus 
funciones. 
Hay, sin embargo, algunos datos contrarios a esta hipótesis sensoriofuncional. El más 
importante es que se han encontrado pacientes con déficits específicos para la categoría seres 
vivos que tenían igualmente dañados (o conservados) los rasgos perceptivos y los 
funcionales (Laia-cona, Bárbarotto y Capitani, 1993). Incluso se han descrito pacientes con 
graves dificultades para procesar los rasgos visuales que no tenían especiales dificultades con 
los seres vivos (Coltheart et al., 1998). 
Otro dato contrario a esta teoría es que no siempre se producen en paralelo las alteraciones 
en las categorías que comparten rasgos. Los pacientes con trastornos en la categoría seres 
vivos no siempre tienen dificultades con los instrumentos musicales, ni los que tienen 
alteración con los objetos inanimados tienen siempre dificultades con las partes del cuerpo. 

e Teoría del conocimiento específico de dominio 
Según esta teoría, no son las propiedades perceptivas o las funcionales las que determinan la 
separación de las categorías semánticas, sino que ha sido la propia evolución del cerebro 
humano la que ha determinado la organización del sistema conceptual. Contrariamente a la 
teoría sensoriofuncional, Caramazza y Shelton (1998) sostienen que el sistema conceptual 
está organizado en amplios dominios como resultado del desarrollo de mecanismos 
neuronales destinados al procesamiento de tipos específicos de estímulos. En principio, esta 
teoría distingue entre los dominios de animales, vegetales y artefactos, pero no descarta la 
existencia de más dominios, por ejemplo, el de los congéneres. El argumento es que la 
presión evolutiva condujo a adaptaciones específicas para reconocer y responder de manera 
diferencial a estos dominios específicos, ya que las consecuencias para la supervivencia son 
muy diferentes. Los congéneres son una ayuda y protección, los animales son potenciales 
predadores (y comida), las plantas son fuente de alimentación y medicina y los objetos 
inanimados podían ser utilizados para defenderse del peligro. De esta manera, las 
adaptaciones evolutivas para distinguir los diferentes tipos de estímulos pudieron haber 
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servido de marco en torno al cual se organizó todo el sistema conceptual. Para nuestros 
antepasados era crucial diferenciar rápidamente si aquello que encontraban era un animal -y, 
por lo tanto, algo peligroso o algo que podía servir de alimento- o era un objeto que podía 
utilizarse para defenderse del peligro. 
Un dato importante a favor de esta teoría es el hecho de que la distinción entre estos grandes 
dominios se produce ya en los primeros meses de vida del bebé y también en los primates 
superiores, lo que apunta a su carácter innato. Otro dato a favor reside en las disociaciones 
entre estos dominios que presentan los pacientes con lesiones cerebrales, pues se han 
encontrado disociaciones dobles entre los dominios de animales, vegetales y objetos 
inanimados, es decir, pacientes que tienen dañada una de esas categorías mientras conservan 
las otras (Caramazza, 1998). Los datos obtenidos con las técnicas de neuroimagen y con los 
estudios de pacientes con lesión cerebral parecen indicar que la categoría seres vivos 
depende del área temporooccipital, y la de los objetos inanimados, del área frontoparietal. 
Sin embargo, también hay datos contrarios a esta teoría. El más importante es que no 
siempre se encuentra correlación entre la categoría afectada y el área cerebral dañada en los 
pacientes. Así, por ejemplo, el paciente EW (Caramazza y Shelton, 1998) tenía dificultades 
con la categoría de animales y, sin embargo, presentaba una lesión en el lóbulo frontal 
izquierdo y en los lóbulos parietales. Tampoco los estudios de neuroimagen demuestran una 
correlación clara entre las categorías semánticas y las áreas cerebrales activadas y, de hecho, 
suelen poner de manifiesto que las dos grandes categorías activan básicamente las mismas 
áreas cerebrales. 

e Teoría conexionista 
Según la teoría conexionista (Tyler y Moss, 2001), existe un único sistema semántico sin 
separación en categorías ni funcionales ni neuroanatómicas. Para los defensores de esta 
teoría, todos los conceptos se encuentran distribuidos en una misma red semántica, pero 
aquellos que comparten rasgos están más próximos y, por lo tanto, son más susceptibles de 
resultar afectados conjuntamente cuando se lesiona esa parte de la red. Así, los conceptos, 
león, tigre y de los restantes animales mamíferos comparten muchas propiedades semánticas 
y, por lo tanto, están próximos en la red, de manera que hay muchas posibilidades de que una 
lesión en esa zona los afecte a todos conjuntamente. Es el simple solapamiento de rasgos el 
que genera las diferentes categorías y subcategorías semánticas. 
Cada concepto tiene algunos rasgos que son comunes con los restantes conceptos de la 
misma categoría (el león, el tigre, la pantera, etc., comparten muchos rasgos: forma del 
cuerpo, cuatro patas, tamaño, piel, etc.) y otros que son distintivos del concepto (el león tiene 
melena, el tigre tiene rayas, la pantera tiene puntos, etc.). Los rasgos comunes son los que 
propician que esos conceptos estén próximos en la red conceptual y que, cuando se dañan, 
afecten a todos los conceptos que los comparten. En el caso de los seres vivos, los rasgos 
distintivos son más vulnerables porque tienen menos relación con las restantes propiedades, 
de ahí que una lesión leve puede conllevar que los pacientes reconozcan estos animales como 
mamíferos, salvajes, etc., pero no consigan diferenciar si se trata de una pantera o un tigre. 
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En el caso de los objetos inanimados, los rasgos distintivos no resultan afectados tan 
fácilmente porque son los que caracterizan el objeto: por una parte, hay menos rasgos 
comunes con otros objetos y, por otra, hay una estrecha relación entre la forma del objeto y 
su función (la forma afilada del cuchillo para cortar, la forma gruesa del martillo para 
golpear, etc.). 

Un dato contrario a esta teoría es el hecho de que nunca se producen trastornos en categorías 
específicas, por ejemplo, en las categorías de mamíferos, peces o aves. Si los déficits que se 
observan en los pacientes para las diferentes categorías se deben a que afectan los rasgos 
comunes de los ejemplares de esas categorías, ¿por qué nunca se ha encontrado un déficit 
para la categoría aves o para la categoría peces si todos los ejemplares tienen varios rasgos 
comunes y, por lo tanto, ocupan un espacio concreto de la red semántica? 


BASES NEUROLÓGICAS DEL SISTEMA SEMÁNTICO 

Los datos obtenidos con las técnicas de neuroimagen y con los estudios de pacientes con 
lesión cerebral parecen indicar que las redes con información semántica se extienden por 
amplias zonas del cerebro, incluyendo los lóbulos temporales, parietales y frontales. Como 
se indicó en el apartado anterior, los trastornos en la categoría seres vivos se producían 
principalmente por lesiones en el área temporooccipital, mientras que los trastornos en la 
categoría de los objetos inanimados se producían por lesión del área frontoparietal. Cada vez 
hay mayor consenso en que tres zonas corticales son responsables del procesamiento 
conceptual: la zona inferior del lóbulo frontal izquierdo, la zona temporoparietal izquierda y 
las zonas temporales inferior y media de ambos hemisferios. Y, por supuesto, las vías 
subcorticales que unen esas áreas, principalmente el fascículo arqueado. 

Entre esas tres áreas se extienden innumerables redes neuronales responsables de cada uno 
de los conceptos. Según la teoría de la percepción-acción, los conceptos se forman cuando la 
persona percibe un estímulo y realiza la acción correspondiente a ese estímulo, pues lo que 
hace es conectar neuronas perceptivas con neuronas motoras formando una nueva red, 
circuito o asamblea de neuronas (Pulvermiiller, 1999). Cada concepto sería, por lo tanto, el 
resultado de la red que se forma con las neuronas responsables del procesamiento de los 
rasgos perceptivos, de las propiedades motoras y de las conexiones entre ellas. En función de 
cada concepto, varía la predominancia de rasgos de un tipo u otro; así, en los conceptos 
referidos a los seres vivos predominarán los rasgos perceptivos, mientras que en las acciones 
predominarán los motores. Las teorías corpóreas (embodied) postulan diferentes 
distribuciones de los conceptos por el cerebro en función de las características perceptivas y 
motoras de los conceptos (Pulvermiiller, 2012). 

En este sentido, las redes neuronales responsables de los conceptos con un alto contenido 
motor se extienden por la zona motora en los lóbulos frontales, las de los conceptos con alto 
contenido visual por los lóbulos occipitales, las de los conceptos con alto contenido táctil por 
los lóbulos parietales, etc. Todas esas redes se extienden también por la zona perisilviana, ya 
que todos los conceptos tienen nombres que se activan junto con sus significados. Así, 
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puesto que el conocimiento del concepto «rosa» incluye rasgos visuales referentes a su 
forma, su color y su olor, la red responsable de este concepto se extenderá por las zonas 
visuales, olfativas, etc., además de la perisilviana. De hecho, los estudios de neuroimagen 
muestran gran activación en las áreas occipitales y temporal inferior mientras los sujetos 
procesan estímulos cuyos rasgos son principalmente visuales (p. ej., frutas, colores, etc.), en 
cambio cuando procesan estímulos relacionados con acciones (p. ej., verbos, herramientas, 
etc.) se produce gran activación en la corteza frontal inferior, principalmente en el área 
premotora. Pero no sólo existen los rasgos visuales y motores, dado que algunos conceptos 
destacan por sus rasgos táctiles (p. ej., «rugoso») y activan la zona sensoriomotora, otros por 
los rasgos sonoros (p. ej., «claxon») y activan la auditiva, otros, en fin por los rasgos olfati- 
vos y activan la zona olfativa. González et al. (2006) comprobaron que la lectura de palabras 
semánticamente relacionadas con los olores (p. ej., «canela») activaban las regiones 
cerebrales del olfato. Asimismo, palabras como «sal», con fuertes connotaciones gustativas, 
activan las áreas cerebrales que procesan los sabores reales (Barrós-Loscertales et al., 2012). 
Incluso se ha comprobado que, según el tipo de acción que expresen los conceptos, las áreas 
motora y premotora que se activan son diferentes. Es bien conocido que la corteza motora 
está organizada de manera somatotópica, con la cara representada en la parte baja de la franja 
motora, próxima a la fisura silviana, los brazos y las manos en la parte media y las piernas y 
los pies en la parte superior (homúnculo de Penfield). Pues bien, los conceptos referentes a 
acciones que se realizan con la boca (p. ej., «lamer» o «soplar») producen mayor activación 
en la parte baja de las áreas motora y premotora, los conceptos referentes a acciones que se 
realizan con la mano (p. ej., «agarrar») activan la parte media, y los conceptos referentes a 
acciones que se realizan con el pie (p. ej., «patear») activan la parte alta de la corteza (Hauk, 
Johnsrude y Pulvermiiller, 2004) (Fig. 7-6). 


Palabras relacionadas Palabras relacionadas Palabras relacionadas 
con la pierna con el brazo con la cara 


Figura 7-6. Zonas de la corteza motora que se activan durante el procesamiento de palabras relacionadas con 
distintas partes del cuerpo: piernas, brazos y cara. Los puntos blancos corresponden a las áreas del lenguaje, mien- 
tras que los puntos azules corresponden a las áreas motoras y premotoras relacionadas con pierna/pie («patear»), 
brazo/mano («agarrar») o cara/boca («soplar»). Adaptado de Hauk, Johnsrude y Pulvermiiller (2004). 
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Además, los circuitos cerebrales responsables de los conceptos no sólo se extienden por la 
corteza, sino que alcanzan también a las estructuras subcorticales. Todas las áreas corticales 
tienen proyecciones a los ganglios básales, que a su vez conectan al tálamo y vuelven a la 
corteza, formando circuitos corticosubcorticales que, entre otras muchas funciones, también 
intervienen en el lenguaje. De hecho, algunas lesiones subcorticales producen trastornos 
lingúísticos, por ejemplo los trastornos de lenguaje en enfermos de Parkinson. Las palabras 
con contenido emocional parecen depender de circuitos que se extienden por esas áreas 
subcorticales, principalmente por el sistema límbico responsable de las emociones. Algunos 
estudios de neuroimagen han comprobado que se produce activación en las estructuras 
límbicas cuando se procesan palabras de contenido emocional (Pulvermiiller, 2012). 

En cuanto a los conceptos abstractos que parecen no depender de rasgos perceptivos ni 
motores concretos, las teorías corpóreas postulan que se producen a partir de rasgos comunes 
a los conceptos concretos, a partir de los cuales se forman. Así, el concepto «animal» se 
forma a partir de varios conceptos concretos: gato, perro, liebre, gusano, etc. El concepto 
«gato» activará un circuito formado por neuronas responsables del procesamiento de 
determinados rasgos, principalmente visuales. El concepto «ratón» también activará ciertas 
neuronas, algunas comunes con las del concepto gato y otras diferentes. Lo mismo sucederá 
con los conceptos «perro», «vaca», etC., y para el concepto abstracto «animal» se producirá 
la activación de neuronas que son comunes a perro, gato, vaca, etc. De esta manera, también 
se explica que unos conceptos sean más típicos de la categoría que otros. El hecho de que 
«perro» sea un ejemplar más típico de la categoría «animal» que «pulpo» o «caracol» se 
debe a que su circuito es más similar, comparte más neuronas, que el del pulpo o el caracol 
con el concepto animal. 

Una cuestión importante y muy discutida hoy en día es si realmente las redes semánticas se 
extienden por todas esas zonas del cerebro o si algunas de esas zonas cumplen un papel en el 
acceso al significado o en operaciones posteriores al procesamiento semántico más que en el 
propio procesamiento semántico. Es muy posible que en los estudios de neuroimagen se 
observe activación en amplias zonas porque la operación de acceso al significado ponga en 
juego determinadas funciones ejecutivas que no son específicas del sistema semántico. Tam- 
bién podría tratarse de procesos posteriores a la comprensión, por ejemplo, por los 
pensamientos e imágenes que esos conceptos generan, en los cuales se activan sus rasgos 
perceptivos y motores y que podrían no ser parte fundamental de la comprensión. Mahon y 
Caramazza (2008) hablan de epifenómenos. En el caso de los pacientes podría ocurrir que las 
lesiones en ciertas áreas afectaran a determinados rasgos perceptivos y funcionales y que esa 
pérdida dificultara el acceso a los conceptos. En definitiva, el hecho de que algunas áreas 
participen en el procesamiento de un concepto no significa que esas áreas sean responsables 
del conocimiento conceptual: podrían intervenir en el acceso, o sólo en momentos 
posteriores al propio acceso (Fig. 7-7). 
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Figura 7-7. Distribución de la red semántica en la corteza cerebral según el modelo distribuido (A) y el modelo 
del centro de actividad (B, hub). Tomado de Patterson et al. (2007). 


Algunos autores (p. ej., Whitney et al., 2011) hablan de dos componentes, estrechamente 
unidos pero independientes en el procesamiento semántico: el conocimiento conceptual y los 
mecanismos ejecutivos responsables del acceso a ese conocimiento. Dependiendo de la tarea 
y del propio concepto, el papel de los mecanismos ejecutivos es fundamental. En algunas 
tareas (p. ej., la lectura de palabras) el acceso al significado se produce de manera casi 
automática y el papel de las funciones ejecutivas es mínimo, pero en otras (p. ej., la de 
asociación semántica, en la que hay que establecer relaciones entre los conceptos), el trabajo 
de las funciones ejecutivas es fundamental. También es importante el papel de las funciones 
ejecutivas cuando se requiere extraer una información muy particular del concepto. De cada 
concepto tenemos gran cantidad de información, pero generalmente no la extraemos toda, 
sino sólo la que es relevante para cada situación. Así, por ejemplo, de los perros sabemos que 
son animales de compañía, que hay muchas razas diferentes, que son fieles, que son 
mamíferos, etc., pero también sabemos que pueden transmitir la rabia, que ensucian las 
aceras, que nos despiertan por la noche con sus ladridos, etc. Toda esa información no se 
activa cuando oímos la palabra perro, sino sólo la relevante a cada situación; así, cuando 
escuchamos la oración «el niño fue atendido en el hospital por la mordedura de un perro» 
activamos información muy distinta de cuando oímos «el perro de María ganó un concurso 
de belleza». La selección de la información relevante para cada situación es tarea de los 
mecanismos ejecutivos. 

Una teoría reciente defendida por Patterson, Néstor y Rogers (2007), denominada teoría hub 
(o centro de actividad), sostiene que las redes neuronales correspondientes a los distintos 
conceptos, además de distribuirse por las áreas perceptivas y motoras, también se extienden, 
y de manera fundamental, por una zona del cerebro responsable del conocimiento conceptual 
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puro independiente de la modalidad sensorial. La razón para proponer este componente 
central amodal es que los conceptos son, según estos autores, entidades abstractas, formadas 
a partir de la destilación de estímulos concretos y a los que se puede acceder desde distintas 
modalidades sensoriales. Cuando a causa de una lesión cerebral se dañan algunos conceptos, 
los pacientes no pueden recuperarlos por ninguna de las modalidades sensoriales: ni a través 
de las palabras, ni de los dibujos, ni del tacto. De hecho, muchos conceptos son totalmente 
abstractos y no dependen de ninguna modalidad sensorial ni motora, pues son el resultado de 
la integración de otros conceptos concretos con características comunes pero que pueden 
tener diferentes rasgos perceptivos. Es el caso de las categorías supraordenadas, como, por 
ejemplo, el concepto «mueble», que está formado por objetos muy variados en cuanto a 
formas y colores, pero que tendrían, todos ellos, algo en común a partir de lo cual surge este 
nuevo concepto. También es el caso de conceptos totalmente abstractos, como amistad, 
dogma o justicia, que no están relacionados con ninguna modalidad sensorial. Realmente, si 
las redes conceptuales se distribuyesen sólo por áreas perceptivas y motoras sería muy difícil 
formar los conceptos abstractos. 

Hace ya tiempo que se conoce la existencia de zonas cerebrales que no están asociadas a una 
función perceptiva o motora específica. Las lesiones en estas áreas no se asocian a una 
alteración tan evidente como las lesiones en las áreas perceptivas (aunque los efectos reales 
suelen ser más graves). Damasio (1989) habla de zonas de convergencia, es decir, lugares 
donde convergen informaciones sensoriales diferentes. Así, hay una zona en la que 
convergen la información visual de la forma y la información de la acción, otra en la que 
convergen la representación de la forma y el nombre del objeto, etc. De hecho, cada zona es 
importante para una categoría semántica determinada. Así, la zona en la que convergen 
formas y movimientos es esencial para el conocimiento de los animales, la zona en la que 
convergen forma y color es importante para el conocimiento de las frutas, la zona en la que 
convergen formas y acciones es fundamental para el conocimiento de los objetos hechos por 
el hombre, etcétera. 

Además de esas zonas en las que convergen distintas informaciones sensoriales y motoras, la 
teoría hub postula una zona amodal, un centro distribuidor de actividad donde están 
representados todos los conceptos, sea cual fuere la categoría semántica a la que pertenezcan 
y sean cuales fueren los rasgos perceptivos más destacados. Una lesión en esta zona 
produciría una alteración semántica con independencia de la modalidad perceptiva en que se 
presente (visual, auditiva, táctil) y de la modalidad de respuesta que se le pida (denominación 
oral, escrita, dibujo, mímica, etc.). 

Los datos provenientes tanto de la clínica como de los estudios de neuroimagen apuntan a 
que esa zona amodal podría situarse en la parte anterior de los lóbulos temporales, puesto 
que esta región es crítica en el procesamiento semántico (Patterson et al., 2007). Los 
pacientes con daño semántico puro debido a encefalitis por herpes simple tienen siempre 
dañada esa zona temporal anterior. También en la enfermedad neurodegenerativa 
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denominada demencia semántica, cuyos primeros síntomas son puramente semánticos, la 
atrofia cerebral comienza en esa zona. 


Recuadro 7-3. Trastornos semánticos frente a trastornos de acceso semántico 


Los pacientes que sufren una enfermedad neurodegenerativa denominada demencia semán- 
tica presentan graves trastornos de tipo semántico desde el comienzo de la enfermedad, 
mientras que conservan las restantes Capacidades cognitivas y lingúísticas (tienen buena 
memoria y atención, conservan la sintaxis, la fonología, etc.). La atrofia que produce esta 
enfermedad se circunscribe a la zona anterior de los dos lóbulos temporales, y se ha 
comprobado que existe una correlación entre el grado de atrofia cortical en esa zona y la 
gravedad del trastorno semántico (Mummery et al., 2000). 

Otros pacientes con lesiones en las zonas temporoparietal y prefrontal inferior izquierdas 
(generalmente por accidentes cerebrovasculares) también presentan dificultades con los 
conceptos, por lo que aparentemente tienen cierta similitud con los pacientes que padecen 
demencias semántica. Sin embargo, un análisis minucioso descubre diferencias importantes. 
Jefferies y Lambón Ralph (2006) compararon la ejecución de 10 pacientes con demencia 
semántica, con atrofia en la zona anterior de los dos lóbulos temporales, con la de otros 10 
pacientes afásicos, con lesiones en las zonas temporoparietal y prefrontal inferior izquierdas, 
en varias tareas semánticas. Aunque los pacientes obtuvieron puntuaciones similares en 
muchas de las tareas, había claras diferencias cualitativas entre los dos grupos. 

Los pacientes con demencia semántica mostraban una fuerte consistencia en los ítems, en el 
sentido de que aquellos conceptos en los que fallaban en una tarea solían fallarlos también 
en las otras, y los que acertaban en una los acertaban en el resto. En cambio, en los pacientes 
afásicos había poca consistencia entre los ítems de una tarea a otra. Los pacientes con 
demencia semántica eran sensibles a la familiaridad de los conceptos, de manera que los 
conceptos más familiares eran más resistentes al deterioro, mientras que los pacientes 
afásicos eran poco sensibles a la familiaridad de los estímulos. A los pacientes con 
demencia semántica el proporcionarles una clave fonológica en la tarea de denominación de 
dibujos no les servía de mucha ayuda, en cambio las claves fonológicas mejoraban 
considerablemente la ejecución en los pacientes afásicos. 

Estos resultados indican claramente que los pacientes con demencia semántica, a causa de la 
atrofia cerebral que sufren en los lóbulos temporales, van perdiendo los conceptos, 
comenzando por los menos familiares, de ahí el efecto de la familiaridad. Una vez que han 
perdido un concepto no pueden procesarlo correctamente, con independencia de la tarea que 
se realice, ni tampoco aunque se utilicen ayudas como las claves fonológicas, porque 
simplemente ya no disponen de él. En cambio, los pacientes afásicos siguen disponiendo de 
los conceptos; su problema es que no consiguen acceder a ellos, por eso hay poca 
consistencia entre los ítems, porque unas veces consiguen recuperarlos y otras no, 
dependiendo de la tarea y del estado de activación del propio paciente. Por la misma razón, 
las claves fonológicas son de gran ayuda a los pacientes afásicos porque permiten la 
recuperación del concepto al que les cuesta llegar. 
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Estos resultados apoyan la hipótesis de que la zona anterior de los dos lóbulos temporales es 
la base neurológica del sistema semántico, mientras que las zonas temporoparietal y 
prefrontal inferior izquierdas participan en el acceso al sistema semántico. 


Como se describe en el recuadro 7-3, los pacientes con demencia semántica sufren una 
pérdida conceptual importante en ausencia de otros trastornos de memoria o lenguaje. De 
hecho, conservan perfectamente los recuerdos episódicos y tienen un lenguaje 
gramaticalmente correcto, aunque vacío de contenido por sus problemas semánticos. Esta 
pérdida conceptual se relaciona con la atrofia en esa zona de la parte anterior de los lóbulos 
temporales: a mayor atrofia, mayor alteración semántica. Incluso en las personas sanas a las 
que se les genera una «lesión virtual», inhibiendo la actividad del lóbulo temporal anterior 
mediante estimulación magnética transcraneal repetitiva, se producen momentáneamente 
pérdidas de información conceptual o semántica (Pobric et al., 2007). 

Como se ha indicado anteriormente, hay tres zonas corticales (la parte anterior de los dos 
lóbulos temporales, izquierdo y derecho, el área temporoparietal izquierda y el área 
prefrontal inferior izquierda) que siempre se activan cuando se realizan tareas semánticas, 
como la denominación de dibujos, la asociación semántica o la fluidez verbal y que, cuando 
sufren una lesión, producen trastornos semánticos. Sin embargo, los defensores de la teoría 
hub sostienen que sólo las zonas temporales anteriores corresponden al sistema semántico, y 
que las otras dos son más bien áreas ejecutivas que participan en el acceso al sistema 
semántico. Cuando accedemos automáticamente a un concepto sólo necesitamos la 
activación de esas zonas temporales, pero cuando tenemos que realizar una búsqueda 
consciente en el sistema semántico necesitamos el funcionamiento de las zonas 
temporoparietal y prefrontal inferior izquierdas. Del mismo modo, cuando se produce una 
lesión en las zonas temporales aparece un trastorno semántico que afecta a los conceptos, 
cualesquiera que sean la tarea que se utilice y la modalidad. Cuando un paciente con una 
lesión en esa zona no entiende un concepto, importa poco que se le presente en forma de 
palabra oral o escrita, de dibujo o fotografía o que lo toque o lo huela, no podrá reconocerlo 
porque es el propio concepto lo que ha perdido. En cambio, cuando se produce una lesión en 
las zonas temporoparietal y prefrontal inferior izquierdas el trastorno se manifiesta sólo en 
determinadas tareas, aquellas que exigen una mayor participación de las funciones 
ejecutivas. Estos pacientes pueden no entender un concepto presentado en una modalidad 
determinada, pero comprenderlo si se presenta en otra modalidad. 

Parece bastante verosímil que la zona anterior de los dos lóbulos temporales sea la 
responsable de las representaciones semánticas amodales, dado que tiene ricas conexiones 
con las áreas corticales responsables de la información específica de la modalidad. De esta 
manera puede recoger la información sensorial, funcional y verbal de los estímulos para 
extraer las propiedades de alto orden y quedarse con una representación abstracta y amodal. 
Realmente, las representaciones que tenemos de los conceptos son abstractas, puesto que no 
se corresponden con ningún estímulo determinado. El concepto de silla recoge los 
principales rasgos que definen a una silla, pero no se corresponde con ninguna silla concreta. 
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También encaja con los datos neuropsicológicos que las zonas temporoparietal y prefrontal 
inferior izquierdas se encarguen del acceso controlado a la información semántica. Es bien 
conocido que la zona prefrontal inferior desempeña un importante papel en las funciones 
ejecutivas en general y en la búsqueda activa de la información en particular, y que la zona 
temporoparietal está estrechamente conectada a la prefrontal a través del fascículo arqueado, 
por lo que esas dos regiones forman parte de un mismo sistema neuronal destinado al control 
semántico. 

En definitiva, según Jeíferies y Lambón Ralph (2006), nuestra capacidad para usar de 
manera eficiente el sistema semántico depende de dos elementos interactivos: un conjunto de 
representaciones amodales y un control semántico responsable del acceso a esas 
representaciones. Hay ciertos aspectos de los conceptos a los que es posible acceder de 
manera automática, pero hay muchos otros que requieren un acceso controlado para extraer 
en cada momento, y en función de la tarea, la información más apropiada. En la figura 7-7 se 
pueden ver las dos teorías expuestas: la teoría de redes distribuidas, que defiende que los 
conceptos están representados por la corteza en función de sus características perceptivas y 
motoras, y la teoría del centro de actividad, que considera que, además de las redes 
distribuidas, existe un centro de actividad responsable del conocimiento conceptual puro. 


RESUMEN 

e Los significados de las palabras forman nuestro sistema conceptual. La facilidad y 
rapidez con la que recuperamos esos significados sugiere que el sistema conceptual 
debe estar muy bien organizado. 

e Desde la psicología cognitiva se han propuesto varias teorías para explicar la 
organización de los significados en el sistema conceptual o semántico. Las tres más 
conocidas son la teoría de redes, que sostiene que los conceptos se encuentran 
conectados entre sí formando una gran red conceptual; la teoría de rasgos, que afirma 
que los conceptos se representan en la memoria por medio de conjuntos de rasgos 
semánticos, y la teoría basada en prototipos, que defiende que los conceptos aparecen 
agrupados por la semejanza familiar que existe entre ellos. 

e Desde la neurociencia cognitiva, a partir de los estudios de pacientes con lesión 
cerebral y de los estudios de neuroimagen, también se han propuesto varias teorías 
explicativas: teoría sensoriofuncional, teoría del conocimiento específico de dominio 
y teoría conexionista. 

e En cuanto a las bases neurológicas, cada vez hay más consenso en que son tres las 
zonas corticales responsables del procesamiento conceptual: la zona inferior del 
lóbulo frontal izquierdo, la zona temporoparietal izquierda y las zonas temporales 
inferior y media de ambos hemisferios. A ellas se añaden, por supuesto, las vías 
subcorticales que unen esas áreas, principalmente el fascículo arqueado. Cuando una 
persona sufre una lesión puntual en alguna de esas zonas (afasia) o atrofia cerebral 
(demencia semántica) presenta trastornos de tipo semántico. 


booksmedicos.org 


30 


Psicología del Lenguaje — TEMA 7 


Preguntas de reflexión 
e ¿Cuál es la metodología más usada para estudiar el procesamiento semántico? 


e ¿Por qué la teoría de redes de Collins y Quillian tuvo que ser reformulada por Collins 
y Loftus? 

e ¿Qué teoría cognitiva sostiene que agrupamos los objetos por su semejanza familiar 
entre ellos? 

e ¿Qué teoría neurocognitiva sostiene que la separación de los conceptos en categorías 
es fruto de la evolución de la especie humana? 

e ¿Cuáles son las áreas cerebrales responsables del procesamiento semántico? 

e ¿Cuál es la principal diferencia entre la teoría del centro de actividad y la de redes 
distribuidas? 
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COMPRENSIÓN DE ORACIONES 


Objetivos de aprendizaje 
Al finalizar el capítulo el alumno será capaz de: 
e Entender las teorías de segmentación sintáctica de las oraciones, basadas en 
planteamientos estructurales. 
e Comprender cómo el lector o el oyente resuelve los problemas de ambigúedad 
sintáctica. 
e Entender las teorías funcionales del procesamiento sintáctico de las oraciones, 
especialmente la funcionalidad de las anáforas, de la negación y de los conectores. 
e Descubrir y valorar el papel del lenguaje no literal, especialmente las metáforas y los 
enunciados contrafactuales. 
e Entender el papel de las representaciones mentales corpóreas en la comprensión de 
oraciones. 


INTRODUCCIÓN 
Es obvio que la comprensión del lenguaje va más allá del reconocimiento de palabras aisladas, 
ya que en contextos naturales las palabras se presentan casi siempre agrupadas en oraciones. 
Generalmente, cuando hablamos no pronunciamos palabras aisladas como «gato» o «mesa», 
sino que expresamos ideas que requieren la combinación de varias palabras en oraciones como 
«el gato saltó sobre la mesa» o «un gato se escondió bajo la mesa» o «no me gusta que el gato 
se suba a la mesa». En otras palabras, realizamos actos predicativos, decimos algo sobre algo. 
Desde el punto de vista del lector u oyente, la interpretación de una oración conlleva procesos 
específicos que no ocurren durante el reconocimiento de palabras aisladas. Veamos un 
ejemplo de oración relativamente compleja: 

El niño asustó a la gata amarilla y ésta salió corriendo [1] 
Para comprender esta oración es preciso ejecutar todos los procesos ortográficos, fonológicos, 
de acceso léxico y semánticos, tratados en capítulos anteriores, para cada una de las palabras 
individuales. Pero, además, el lector debe realizar ciertos procesos de segmentación de la 
oración en unidades sintácticas. Así, agrupará ciertas palabras en unidades mayores 
denominadas sintagmas, gracias a la concordancia gramatical entre ellas. Por ejemplo, «la gata 
amarilla» forma un sintagma, ya que las tres palabras comparten género y número y 
constituyen una unidad de significado. Asimismo, el lector deberá descomponer la oración en 
sus cláusulas constituyentes, que tienen una relación, en este caso de coordinación, entre ellas: 
[el niño asustó a la gata amarilla] y [y ésta salió corriendo]. Además, debe establecer vínculos 
de correferencia entre las palabras de las cláusulas, por ejemplo, el pronombre «ésta» es una 
anáfora que se refiere a «la gata amarilla» previamente mencionada. 
El orden de las palabras también es un elemento sintáctico de primer orden, que contribuye a 
que el lector establezca las funciones de cada uno de los conceptos en esa oración específica. 
Por ejemplo, «el niño» aparece como sujeto de la oración y, por lo tanto, es el agente de la 
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acción, mientras que «la gata» es objeto o receptor de la acción. Si se alterase el orden de 
algunas palabras, la interpretación sería diferente (p. ej., «la gata amarilla asustó al niño y 
[éste] salió corriendo»), o incluso la oración podría resultar totalmente incoherente (p. ej., «el 
amarilla asustó ésta a la y niño corriendo salió gata»). En suma, el lector u oyente debe mostrar 
unas competencias lingúísticas que le permitirán categorizar distintas clases de palabras 
(nombres, verbos, adjetivos, etc.) segmentar el texto en constituyentes gramaticales 
(sintagmas, cláusulas, oraciones) y establecer vínculos de correferencia entre palabras situadas 
en diferentes constituyentes. Estas competencias son intuitivas y pragmáticas, muy diferentes 
de los conocimientos formales del lenguaje establecidos por los lingiistas. En otras palabras, 
el usuario de la lengua no tiene por qué haber estudiado gramática (puede ser totalmente 
analfabeto) para aplicar correctamente sutiles operaciones sintácticas durante la comprensión 
del lenguaje. Además, estas operaciones se ejecutan a gran velocidad, en fracciones de 
segundo, y de forma inconsciente. 

La realidad psicológica de la segmentación en unidades gramaticales está avalada por un 
hecho importante: las unidades de entonación prosódica en el habla coinciden con unidades 
gramaticales. Así, el análisis de las pausas en el habla espontánea o en la lectura en voz alta 
indica que realizamos pequeñas pausas entre sintagmas, y pausas más largas entre cláusulas, 
como se verá en el capítulo 9. Igualmente, durante la lectura silenciosa los lectores realizan 
también pausas espontáneas al final de las cláusulas y de las oraciones, como demuestran los 
estudios que registran los movimientos oculares (Just y Carpenter, 1980). Finalmente, según la 
teoría del arranque prosódico, las unidades de entonación prosódica (sintagmas y cláusulas) en 
el habla del adulto podrían servir de pista a los bebés para iniciarse en el aprendizaje de la 
sintaxis (p. ej., Pinker, 1992). Todo esto indica claramente que los usuarios del lenguaje 
segmentan espontáneamente el lenguaje en constituyentes gramaticales. 

La psicología del lenguaje ha intentado desvelar la comprensión de las oraciones, estudiando 
cuidadosamente los procesos subyacentes, haciendo hincapié en los procesos sintácticos, y 
explicándolos mediante modelos teóricos. La sintaxis es un fenómeno emergente en el nivel de 
las oraciones y, para muchos, constituye el aspecto más extraordinario del lenguaje humano, 
que no tiene parangón en ninguna otra especie (véase cap. 2). En este capítulo trataremos dos 
planteamientos diferentes en el estudio psicológico de los procesos sintácticos en las 
oraciones. En primer lugar se abordarán las teorías estructurales, derivadas de la lingúística de 
Noam Chomsky, que frecuentemente asumen que el procesamiento sintáctico se ejecuta en un 
«módulo» que opera de modo independiente de los demás procesos. En segundo lugar se 
tratarán las teorías funcionalistas, emparentadas con la lingúística funcional y cognitiva, que 
generalmente asumen una arquitectura interactiva del lenguaje, es decir, que proponen una 
influencia mutua entre procesos sintácticos, semánticos y pragmáticos. También se revisarán 
algunos aspectos del significado de las oraciones, que tienen que ver con la semántica y la 
pragmática del lenguaje, como la corporeidad del significado, la comprensión de metáforas y 
el procesamiento de la negación y de los enunciados contrafactuales. 
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Las tres perspectivas reflejan procesos psicológicos igualmente importantes en la comprensión 
de las oraciones, pero hacen hincapié en aspectos diferentes. La perspectiva estructural está 
interesada, sobre todo, en cómo el lector u oyente consigue segmentar las oraciones en 
componentes sintácticos organizados jerárquicamente, a partir del input lineal de la oración. 
Aunque estas teorías consideran las posibles interacciones entre la sintaxis y la semántica, este 
último aspecto es relativamente secundario para ellas, ya que no pretenden ser teorías del 
significado. La perspectiva funcionalista, por su parte, analiza cómo algunos términos 
gramaticales (p. ej., pronombres, conjunciones) regulan la activación de los conceptos y la 
correferencia entre éstos durante la comprensión. Este enfoque asume una estrecha relación 
funcional entre sintaxis y significado, de modo que en ocasiones ambos procesos no son 
fácilmente separables (Recuadro 8-1). 


Recuadro 8-1. ¿Es posible una lengua sin sintaxis? 


Aproximadamente la mitad de las palabras que generamos o comprendemos son 
gramaticales: artículos, pronombres, conjunciones, preposiciones, algunos adverbios, verbos 
auxiliares. A esto hay que añadir los morfemas (p. ej., los de género y número), que se 
combinan con las raíces de los nombres, verbos y adjetivos y que también tienen valor 
gramatical. Además, todas las lenguas del mundo poseen elementos gramaticales. ¿Todas? En 
realidad, hay unas pocas excepciones: las denominadas protolenguas, o lenguas 
macarrónicas, apenas tienen gramática. Veamos una conversación en macarrónico entre un 
marinero ruso y otro noruego: 

Ruso: ¿Qué decir? MÍ no comprender. 

Noruego: Caro, ruso... adiós. 

R: Nada. Cuatro medio. 

N: Dar cuatro, nada bien. 

R: No hermano. ¿Cómo mí vender barato? Grande caro harina en Rusia este año. 

N: Tú no verdad decir. 

R: Sí. Grande verdad, mí no mentir, caro harina. 

N: Si tú comprar: cuatro libras. Si tú no comprar: entonces adiós. 

R: No, nada hermano, marchar cubierta. 

Derek Bickerton (1981) describe así las lenguas macarrónicas: «Rara vez, o nunca, tienen 
algún tipo de flexión morfológica (p. ej., sufijos verbales), ni concordancia de número o 
persona, etc. Muy rara vez, o nunca, disponen de verbos auxiliares para expresar tiempo 
verbal, aspecto, igualdad o pertenencia a clase, aunque a veces tienen expresiones para la 
posibilidad o la obligación. No tienen subordinación, ni conjunciones y muy pocas 
preposiciones, artículos o adjetivos demostrativos, aunque pueden incluir algunas negaciones, 
indicadores de preguntas y cuantificadores» (p. 126). 

Estas lenguas emergen en circunstancias especiales, como cuando los marineros rusos y 
noruegos han tenido que comunicarse a lo largo de los años sin disponer de una lengua 
compartida. O, más comúnmente, cuando afluían masivamente inmigrantes o esclavos de 
varios lugares para trabajar en las colonias, como ocurrió en Hawai en el siglo XIX. Estos 
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inmigrantes no compartían lengua entre sí, ni con los colonos, y desarrollaban, en 
consecuencia, una lengua macarrónica, sumamente imperfecta, sin gramática y con mucha 
variabilidad entre los individuos, pero suficiente para mantener cierto nivel de comunicación. 


Quizás el mito de la confusión de lenguas, durante la construcción de la torre de Babel, 
obedezca a una realidad histórica: las grandes obras públicas de la antigijedad reclutaban 
mano de obra procedente de comunidades muy distantes, con lenguas diferentes (y de ahí la 
confusión de las lenguas). Estos trabajadores o esclavos tendrían que comunicarse, 
improvisando alguna forma poco eficiente de lenguaje macarrónico... con la consiguiente 
desorganización en el trabajo. 


Por último, la perspectiva pragmática se interesa por la complejidad semántica de algunos 
tipos de oraciones, en cuya comprensión intervienen procesos no estrictamente lingúísticos. 
Por ejemplo, postulan que en algunas oraciones se activan procesos sensoriomotores o 
corpóreos, conceptos metafóricos o bien supuestos pragmáticos. Las tres perspectivas son 
válidas y complementarias, pero obedecen a planteamientos teóricos y procedimientos 
experimentales diferentes. 


PERSPECTIVA ESTRUCTURAL DE LA GRAMÁTICA 
Noam Chomsky (1957, 1968) desarrolló una teoría lingiística que ha tenido una enorme 
influencia en la psicología del lenguaje y en el nacimiento de la propia psicología cognitiva. A 
Chomsky no le satisfacían las teorías psicológicas sobre el lenguaje acuñadas en su época, que 
explicaban la adquisición del lenguaje como el resultado de procesos asociativos (escuela de 
aprendizaje verbal) o de condicionamiento operante (Skinner). Tampoco estaba de acuerdo 
con las gramáticas de estado finito, de moda entre los lingúistas de la época, que proponían que 
las expresiones gramaticales se generan como cadenas lineales, de izquierda a derecha. Es 
decir, que, según dichas teorías, cada vez que generamos una palabra, ésta determina la 
siguiente palabra con una determinada probabilidad. 
En lugar de ello, Chomsky propone la noción de reglas generativas y de transformación, que el 
usuario de la lengua aplicaría de forma jerárquica, para codificar sintácticamente las oraciones, 
como se ilustra en la figura 8-2. 
Chomsky trató de explicar cuestiones tan enigmáticas como el 
a? hecho de que todos seamos capaces de construir y comprender un 
ET >: número infinito de oraciones diferentes, o que los niños puedan 
| | T T adquirir su lengua materna en un período de tiempo tan breve pese 
a la «pobreza del estímulo» (ausencia de enseñanza formal, 
entorno lingúístico complejo). No hay duda de que Chomsky 
redujo el «espacio problema» de la lingiiística considerablemente, 
al demostrar que con un número pequeño de reglas se puede 
generar y codificar la infinidad de oraciones que somos capaces de 
Figura 8-2. Codificación sintáctica de una oración procesar. Asimismo, el problema de la adquisición del lenguaje se 


con una cláusul A), y reglas generales de 
reescritura (B) s 


o o e reduciría a que el niño, guiado por mecanismos innatos y 


N: sintagma nominal; SV 


complemento re 
O: oración; P 


sintagma verbal; V: verbo. 
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universales, aprenda y aplique ese conjunto limitado de reglas. Pese a la relevancia psicológica 
de estas explicaciones, Chomsky nunca pretendió ser un psicólogo del lenguaje. Según sus 
propios términos la lingúística está interesada más en la competencia sintáctica, que en la 
actuación. El objetivo de una teoría de la competencia es describir las reglas que permiten 
generar oraciones gramaticales y distinguirlas de las no gramaticales. La competencia es un 
aspecto un tanto platónico o idealizado del lenguaje, que se puede describir formalmente sin 
tener en cuenta a las personas que supuestamente le sirven de soporte material. Además, la 
competencia chomskyana se centra en la gramática y se desinteresa por el significado. Sin 
embargo, cuando dirigimos nuestra atención a los usuarios de un idioma, observamos que la 
producción y la comprensión de oraciones no dependen exclusivamente de la competencia 
sintáctica; si así fuese, nos limitaríamos a construir de forma mecánica frases gramaticalmente 
correctas, pero funcionalmente inútiles. La actuación o el uso pragmático del lenguaje está 
guiado por las intenciones comunicativas de los hablantes, su conocimiento del mundo y de los 
estados mentales del interlocutor, las limitaciones de la memoria de trabajo, el contexto, etc. 
Todos estos aspectos no son de interés para la lingúística estructural, pero sí lo son para la 
psicología del lenguaje. 
A pesar de lo dicho, Chomsky tuvo un enorme impacto en la psicología del lenguaje y muy 
especialmente en el estudio del procesamiento sintáctico. Así, en las últimas décadas del siglo 
pasado se desarrollaron decenas de investigaciones sobre los procesos de segmentación 
gramatical (parsing). Los modelos teóricos asumen, en principio, que los lectores u oyentes 
construyen, a partir de las oraciones, estructuras sintácticas de tipo chomskyano, como las 
representadas en la figura 8-2. 

e Teorías basadas en principios 
Estas teorías asumen una concepción modular del lenguaje al estilo de Fodor, es decir que 
postulan estadios de procesamiento autónomos o «encapsulados». Así, al procesarse una 
oración primero operaría el analizador sintáctico que realiza una segmentación, basada 
exclusivamente en información estructural. Sólo en estadios posteriores entrarían en juego 
otros factores no estructurales, como el significado de las palabras, aspectos contextúales del 
discurso o consideraciones pragmáticas que validarían la segmentación hecha u obligarían a 
una nueva segmentación. 
Antes de adentrarnos en la descripción de este tipo de teorías es importante aclarar qué clase de 
fenómenos se estudian empíricamente. La estrategia de investigación es plantear a los 
participantes oraciones gramaticalmente ambiguas y comprobar qué interpretación sintáctica 
desarrollan de forma inmediata y automática. De este modo es posible verificar cuáles son las 
preferencias de segmentación, que según las teorías basadas en principios son universales. 
Consideremos esta oración: 

María vio a Juan cuando iba a la playa. [2] 

Aunque el lector quizá no lo haya notado, porque haya optado inconscientemente por una 
interpretación determinada, hay una ambigiiedad gramatical, ya que el predicado «iba a la 
playa» puede atribuirse alternativamente a «María» o a «Juan». Ambas interpretaciones 
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difieren en la estructura sintáctica: en un caso «iba a la playa» se adjunta como sintagma verbal 
(SV) de María (sintagma nominal [SN]1), mientras que en el otro caso se adjunta como SV de 
Juan (SN2). 
Lyn Frazier y Charles Clifton desarrollaron inicialmente la denominada teoría de vía muerta 
(garden-path) para las oraciones sintácticamente ambiguas. Según esta propuesta, los lectores 
u oyentes eligen inmediatamente una de las estructuras posibles, basándose en dos principios 
universales, es decir, que operan en todas las lenguas: 
* La adjunción mínima: no postular nodos potencialmente innecesarios, es decir, elegir la 
representación sintáctica más simple. 
+ El cierre tardío: unir las nuevas unidades gramaticales a la cláusula o sintagma 
procesado más recientemente. 
Al aplicar estos principios a la oración [2] el lector deberá preferir la adjunción de la cláusula 
adverbial («cuando iba a la playa») a SN2 («Juan»), ya que los componentes adjuntados en la 
estructura resultante están más próximos (cierre tardío) que en el caso contrario de atribuir la 
cláusula adverbial a SN1 («María»), tal como se observa en la figura 8-3. 


m ñ SN1 sv CA | 
dd F =; 2 V P SN2 
N CA N N 
María vio a Juan cuando iba a la playa María vio a Juan cuando iba a la playa 
A B 


Figura 8-3. La oración «María vio a Juan cuando iba a la playa» segmentada según el principio de cierre tardío (A) 
tendría menos coste cognitivo que segmentada como cierre temprano (B), ya que en A los elementos adjuntados 
(cláusula adverbial y SN2) están más próximos que en los elementos adjuntados en B. CA: complemento adverbial; 
N: nombre; O: oración; P: preposición; SN: sintagma nominal; SV: sintagma verbal; V: verbo. 


Dado que la teoría de vía muerta es de carácter modular, los principios de segmentación se 
aplicarían con independencia del significado de las palabras o de cualquier factor semántico o 
pragmático. Por ejemplo, considérese la siguiente oración: 
María vio el faro cuando iba a la playa. [3] 

El mecanismo gramatical atribuiría inicialmente la cláusula adverbial «cuando iba a la playa» 
a SN2 «el faro», produciendo efectivamente una vía muerta, ya que en un momento posterior, 
la influencia de factores semánticos obligaría a dar marcha atrás y cambiar la adjunción a SN1 
(los faros no van a la playa). Esta estrategia de adjunción obligatoria ocurriría tanto en inglés 
como en español o en cualquier otra lengua a la que se tradujese la oración ambigua. ¿Pero es 
esto cierto? 

Poco después de que Frazier (1987) afirmara que esos principios de adjunción mínima y cierre 
tardío eran universales, Cuetos y Mitchel (1988) (véase revisión en Cuetos et al., 1996) 
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compararon el procesamiento de oraciones sintácticamente ambiguas en español y en inglés. 
Eligieron oraciones que incluían una cláusula de relativo (CR) en ambas lenguas: 

Alguien disparó contra el criado de la actriz que estaba en el balcón. [4a] 

Someone shot the servant of the actress who was on the balcony. [4b] 
Ante la pregunta «¿quién estaba en el balcón?»/«who was in the balcony?» los ingleses 
respondían el 58 % de las veces «the actress», mientras que los españoles elegían en el 62 % de 
los casos «el criado». Es decir, la hipótesis de cierre tardío de Frazier (adjunción de CR a SN2) 
se cumplía en los lectores angloparlantes (aunque no de forma espectacular), pero los lectores 
españoles mostraban una preferencia relativa por un cierre temprano (adjunción de CR a SN1). 
Más aun, Cuetos y Mitchell demostraron que los tiempos de lectura aumentaban cuando se 
presentaba tras la CR una desambiguación contraria a las preferencias de adjunción de los 
lectores españoles. Así, el sintagma «con su marido» en [5a] entra en conflicto con la 
adjunción SN1-CR, ya que «su marido» es semánticamente anómalo -o lo era antes de la ley 
de matrimonios gay— respecto a «el criado» y, por lo tanto, se lee más lentamente que ese 
mismo sintagma en el contexto [5b]: 

Alguien disparó contra el criado de la actriz que estaba en el balcón con su marido. 

[5a] 

Alguien disparó sobre la criada del actor que estaba en el balcón con su marido. 

[5b] y 
La preferencia por el cierre temprano en los lectores hispanohablantes se observa no sólo en 
los tiempos de lectura, sino también en la actividad electrofisiológica cerebral (Recuadro 8-2). 


Recuadro 8-2. Correlatos neuronales de la segmentación sintáctica 


Los potenciales evocados relacionados con eventos (event-related potentials, ERP) constitu- 
yen una técnica electrofisiológica muy útil para valorar el curso temporal de la actividad cerebral 
asociada a una tarea. Mediante el empleo de ERP se ha observado que las anomalías sintácticas 
generan algunas respuestas cerebrales características, especialmente en el componente P600, es 
decir una onda de polaridad positiva que ocurre en torno a 600 ms tras la presentación de una 
palabra que contradice la interpretación sintáctica previa. Veamos un ejemplo. 


Carreiras, Salillas y Barber (2004) presentaron a adultos oraciones de relativo ambiguas si- 
milares a las utilizadas por Cuetos y Mitchell, con una resolución favorable a SN1-CR [a] o a 
SN2-CR [b]. Por ejemplo: 


Juan felicitó a la cocinera del alcalde que fue premiada y laureada en las fiestas. la] 
Juan felicitó al cocinero de la alcaldesa que fue premiada y laureada en las fiestas. [b] 


Al registrarse los ERP en la palabra «premiada» se obtuvo un incremento en la amplitud de 
P600 en el contexto [b] favorable al cierre tardio (SN2-CR), lo cual indica un conflicto con la 
segmentación preferida por los hispanoparlantes (5N1-CR), como se muestra en el gráfico (los 
valores positivos están en la parte inferior del eje vertical). 


Electrodo PZ 


——  Favorable a SN1-CR; felicitó a la cocinera del alcalde... premiada 
Favorable a SN2-CR: felicitó al cocinero... premiada 


El componente P600 no es un registro directo de la actividad cerebral durante la segmenta- 
ción sintáctica, sino más bien de la detección de un conflicto entre una información nueva, que 
puede ser semántica, morfológica o pragmática, y el proceso sintáctico ya realizado. Nos propor- 
ciona pistas muy importantes a posteriori de la segmentación que el lector ha hecho. 
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Sin duda, éstas fueron malas noticias para la teoría de vía muerta, ya que no se verificó la 
universalidad de las estrategias de segmentación que postulaba dicha teoría. Frazier y sus 
colaboradores se vieron obligados a introducir una serie de cambios ad hoc en su teoría, para 
ajustarse a los nuevos datos procedentes de los estudios interlingiísticos. Por ejemplo, en su 
última propuesta, la denominada teoría de la interpretación (construal theory) y consideran que 
los principios de adjunción mínima y cierre tardío sólo se aplican rígida y universalmente a un 
conjunto muy limitado de sintagmas o relaciones gramaticales «primarias», correspondientes 
a sujeto, predicado y complementos de las denominadas cláusulas finitas. Por el contrario, las 
oraciones ambiguas que incluyen sintagmas «no primarios», entre ellas las oraciones de 
relativo, se interpretan aplicando mecanismos semánticos de asignación de roles temáticos. 
Así, la segmentación de una oración de relativo ambigua no estará determinada por principios 
rígidos y obligatorios, sino por el dominio temático de la oración, que depende de 
conocimientos léxicos y del mundo. Por ejemplo, en la oración [6a] tendríamos una adjunción 
de CR a SN1, mientras que en [6b] tendríamos una adjunción a SN2: 

Alguien disparó contra el criado del palacio que estaba en el balcón. [6a] 

Alguien disparó hacia la habitación de la actriz que estaba en el balcón. [6b] 

+ Teorías paramétricas de segmentación 

A diferencia de las teorías de vía muerta y sus sucesivas reelaboraciones, las teorías de 
parámetros reconocen que hay diferencias sintácticas cualitativas entre las lenguas, que una 
teoría de la segmentación debe tener en cuenta. Por ejemplo, hay un parámetro lingúístico que 
difiere en inglés y español. La posición de los modificadores en el sintagma nominal: en inglés 
el adjetivo precede al nombre, y en español el adjetivo sigue al nombre. Este hecho favorecería 
que en las oraciones de relativo sintácticamente ambiguas se utilice en español una estrategia 
específica de adjunción de CR al SN1 (el criado en el ejemplo [4a]), «saltándose» el SN2 (de la 
actriz), ya que éste se percibiría como un simple modificador o complemento del nombre 
(Cuetos etal., 1996). 
Otra posibilidad es que las estrategias de segmentación sintáctica se deban simplemente a la 
experiencia acumulada de cada individuo con ambigiúedades del mismo tipo (Cuetos et al., 
1996). En otras palabras, el lector u oyente optará por la adjunción que ha resultado apropiada 
con mayor frecuencia en su experiencia previa. El analizador sintáctico no utilizaría principios 
estructurales sino una estrategia ajustada a la tendencia de resolución más frecuente. Este 
planteamiento estadístico podría explicar las diferencias de adjunción observadas entre el 
inglés y el español para las cláusulas de relativo. Cuetos y Mitchell analizaron corpus de 
lenguaje y comprobaron que en inglés la mayoría de las oraciones de relativo se resolvían 
adjuntando CR a SN2, mientras que en español la adjunción más frecuente era a SN1. 
En conclusión, la tradición estructuralista ha permitido un gran avance en el estudio 
psicológico de la sintaxis. La psicología del lenguaje ha ido más allá del propio Chomsky, al 
propiciar el estudio de la sintaxis como fenómeno psicológico (ejecución en la terminología 
chomskyana), más que la mera descripción formal de las reglas (competencia en la 
terminología chomskyana). Además, la psicología ha puesto el énfasis en la segmentación de 
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las estructuras sintácticas que realiza el lector u oyente a partir del mensaje lingiúístico, que es 
un problema computacional diferente a la generación de oraciones gramaticales por parte del 
hablante. La linealidad del mensaje lingitístico obliga al lector u oyente a realizar apuestas por 
una estructura determinada, antes de disponer de toda la información relevante, llevándole a 
veces a vías muertas y rectificaciones posteriores. Las teorías que hemos considerado aquí han 
puesto de manifiesto la complejidad de estos procesos, y también cómo la investigación 
empírica obliga a los investigadores a modificar sus teorías. 


PERSPECTIVA FUNCIONAL DE LA GRAMÁTICA 

Como se ha mencionado con anterioridad, las teorías de la segmentación sintáctica, herederas 
de la lingúística estructural de Chomsky, hacen hincapié en los procesos de representación 
sintáctica, descuidando o dejando en segundo plano la semántica. Pero también hay lingiistas 
con un planteamiento funcionalista y cognitivo de la gramática, interesados en los procesos de 
construcción del significado y en los mecanismos cognitivos que subyacen a la comprensión 
de oraciones. Desde esta perspectiva, los límites entre sintaxis y semántica se difuminan, ya 
que los propios elementos gramaticales contribuyen activamente a la construcción del 
significado. 

Aunque los lingilistas funcionalistas y cognitivos ofrecen ideas bastante heterogéneas, a 
continuación mencionaremos algunas de ellas de especial relevancia para la investigación 
psicológica del lenguaje. 

La gramática como instrucciones de procesamiento. Según el lingiiista Tom Givón (1992), 
los marcadores gramaticales (preposiciones, pronombres, conjunciones, morfemas, etc.) 
pueden considerarse instrucciones de procesamiento que guían al lector en la ejecución de 
ciertas operaciones mentales, principalmente la regulación del foco atencional, la búsqueda de 
información en la memoria y la integración conceptual. Por ejemplo, los pronombres fun- 
cionan a menudo como anáforas que le indican al lector u oyente qué concepto, mencionado 
previamente, debe mantenerse activado en el foco atencional. Consideremos la oración: 
«Cuando Juan terminó de leer el libro, él lo tiró a la papelera». En la segunda cláusula hay dos 
anáforas pronominales que le indican al lector que mantenga activados los referentes previa- 
mente mencionados: él = Juan, lo = el libro. Del mismo modo que las señales de tráfico son 
instrucciones que indican al conductor cómo debe conducir en cada momento, los marcadores 
gramaticales indican al lector u oyente cómo debe operar con las palabras y los conceptos en 
las oraciones. Obsérvese que en ambos casos esas instrucciones debe ejecutarlas -con mayor o 
menor éxito- el conductor o el lector u oyente, respectivamente. 

Existe una estrecha correspondencia entre forma lingúística y significado. Por ejemplo, el 
sujeto gramatical es en la mayoría de los casos una entidad animada, casi siempre humana, 
consciente, activa y volitiva (Givón, 1990). Aunque en algunos casos el sujeto gramatical 
pueda ser cualquier sintagma nominal (incluyendo un objeto inanimado), lo cierto es que se 
pueden construir muchos más predicados significativos referidos a entidades animadas y sobre 
todo a personas. El paralelismo entre la forma lingúística y el significado se manifiesta 
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también en el hecho de que algunas estructuras o «construcciones» gramaticales expresan 
eventos relevantes de la experiencia humana, como ubicación espacial, relaciones causales o 
acciones de transferencia (Goldberg, 1995). Por ejemplo, las construcciones de doble objeto 
«sujeto-verbo-objeto 1-objeto 2», presentes en oraciones como «el coronel entregó el libro a la 
anciana» O «la niña le contó una historia a su madre», conllevan la idea general de 
transferencia, es decir un agente transfiere un objeto (o una información) a un receptor. 
Figura y fondo. En muchas estructuras predicativas se postula una relación figura/fondo (p. 
ej., Landau y Jackendoff, 1993; Talmy, 2001). La figura es la entidad relativamente 
desconocida que recibe el foco atencional, y el fondo es la entidad más familiar que se utiliza 
como marco de referencia (Talmy, 2001). Por ejemplo, consideremos la oración locativa: «El 
libro rojo está encima de la mesa de mi despacho». La figura es el objeto cuya posición 
deseamos establecer (el libro rojo), y el fondo es el objeto mejor conocido que sirve de marco 
de referencia (la mesa de mi despacho). Una característica del patrón predicativo figura/fondo 
es la asimetría. Así, en las oraciones locativas la figura suele ser más dinámica, de menor 
tamaño y menos saliente que el fondo. Consecuentemente, la inversión de los términos 
determina frases extrañas o con un significado diferente. Así, al invertir la figura y el fondo del 
ejemplo anterior se obtiene: «La mesa de mi despacho está debajo del libro rojo». La asimetría 
predicativa se observa también en los predicados que indican similitud, en los cuales las 
propiedades compartidas por la figura y el fondo deben ser especialmente salientes en el fondo 
(Tversky, 1977). Por ejemplo, en la frase «mi perro es como un león», la similitud que el 
hablante quiere destacar reside en ciertas propiedades sobresalientes del león (fiereza, fuerza, 
etc.) que se transfieren a su perro. De nuevo, la inversión de los términos produce frases 
pintorescas como «un león es como mi perro». 

Perspectiva. Cuando los usuarios del lenguaje deciden comunicarse, necesariamente emarcan 
la descripción de un evento o escenario utilizando un punto de vista determinado. En cierto 
modo, los usuarios del lenguaje no pueden dejar de incluirse a sí mismos en lo que dicen, 
estableciendo un marco espacial, temporal o conversacional centrado en el aquí-ahora-yo. 
Consideremos las oraciones «el toro está detrás de la valla» o «el toro está frente a la valla». 
Ambas oraciones describen una situación análoga pero desde una perspectiva del hablante 
diferente: la primera implica que la valla está entre el toro y el hablante, y la segunda —quizá 
más peligrosa- implica que el toro está entre la valla y el hablante. En otras palabras, la 
relación espacial entre el toro y la valla es la misma, y lo que cambia es la posición del 
hablante. En general, la descripción de relaciones espaciales supone una perspectiva 
determinada del hablante. Así, los términos deícticos «delante de», «frente a», «a la derecha», 
«a la izquierda», «aquí» o «allí» implican un punto de vista particular que se altera cuando los 
interlocutores se mueven. Por otra parte, los mensajes lingiísticos en castellano y en muchas 
otras lenguas implican una perspectiva temporal. No es posible generar una oración sin 
establecer una datación de los eventos respecto al momento del habla (presente, pasado o 
futuro). Para ello, hay diversos recursos verbales, como los morfemas que dan lugar a los 
tiempos verbales o los adverbios de tiempo. Algunas lenguas, como el castellano, establecen 
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además otros matices temporales, indicando si la acción se considera finalizada (escribió una 
carta) o en marcha (escribía una carta). Finalmente, otros elementos de perspectiva son los 
pronombres deícticos («yo», «tú», él/ella) que implican la perspectiva del hablante, la del 
oyente o la perspectiva de otro ajeno al contexto comunicativo, respectivamente. 
En este capítulo hemos seleccionado dos elementos gramaticales que se han estudiado desde 
una perspectiva funcionalista: las anáforas y los conecto res. 
+ Anáforas 

Un tipo de elemento lingúístico que facilita la construcción de la coherencia entre las 
oraciones es la anáfora. El término anáfora describe una palabra referida a un concepto 
mencionado en el contexto previo. Veamos algunos ejemplos: 

Ágata está escribiendo una novela policíaca. Ágata se inspira en los sucesos de la 

prensa. [6a] 

Ágata está escribiendo una novela policíaca. Ella se inspira en los sucesos de la prensa. 

[6b] 

Ágata está escribiendo una novela policíaca. La autora se inspira en los sucesos de la 

prensa.[6c] 

Ágata está escribiendo una novela policíaca y () se inspira en los sucesos de la prensa. 

[6d] 
En [6a] hay una anáfora muy simple consistente en la mera repetición del nombre Ágata. En 
[6b] está el pronombre que se refiere anafóricamente al mismo antecedente Ágata. En [6c] hay 
una anáfora categorial que se refiere al mismo antecedente, Ágata, pero describiéndola como 
«la autora». En [6d] tenemos lo que se denomina una anáfora cero en la que no hay un 
elemento anafórico visible, pero el antecedente, Ágata, sigue implícito en la cláusula. Como 
veremos la anáfora cero es de uso muy común en lengua castellana. 
El estudio de las anáforas atrajo enseguida la atención de los psicólogos del lenguaje por 
diversas razones. En primer lugar, las anáforas son uno de los principales marcadores 
gramaticales («instrucciones de procesamiento») que inducen al lector o al oyente a establecer 
vínculos de correferencia entre las cláusulas y las oraciones. El lector debe resolver cuál es el 
antecedente anafórico para poder integrar las oraciones. En segundo lugar, las anáforas son 
extraordinariamente abundantes en la lengua, sobre todo los pronombres como «él», «ella», 
«ellos», «ellas», «lo», etc., que a menudo funcionan como anáforas. En tercer lugar, el estudio 
del procesamiento anafórico se presta especialmente al uso de los métodos de investigación en 
línea que han desarrollado los psicólogos del lenguaje durante décadas, como las medidas de 
activación o el registro de movimientos oculares. 
Precisamente, una de las primeras tareas de los psicólogos del lenguaje fue tratar de desvelar 
mediante técnicas en línea en qué momento el lector resuelve el antecedente de la anáfora. 
También valoraron en sus experimentos qué factores determinan el coste cognitivo de la 
resolución de la anáfora. Así, la dificultad es mayor cuando la anáfora tiene dos posibles 
referentes (anáfora ambigua) que cuando tiene uno solo, cuando la distancia entre la anáfora y 
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el referente es mayor o cuando el referente no pertenece al tema del discurso (la idea que se 
está desarrollando). 
Las anáforas pueden tener un referente único claro, pero también existen anáforas ambiguas, 
es decir que son gramaticalmente compatibles con dos posibles referentes en la cláusula 
anterior. Veamos ambos casos: 

Arturo le confesó la verdad a Juana porque ella se lo pidió. [7a] 

Laura le confesó la verdad a Juana porque ella se lo pidió. [7b] 
En [7a] la anáfora «ella» se puede resolver fácilmente gracias a que el género gramatical 
concuerda con Juana pero no con Arturo. Pero en [7b] la tarea es cognitivamente más 
compleja, dado que la pista gramatical es ambigua: «ella» concuerda tanto con Laura como 
con Juana en género y número. La resolución en este caso requiere procesos de razonamiento o 
inferencia basados en nuestro conocimiento del mundo: la causa de que Laura confesase fue 
que Juana (ella) se lo pidió. 
Una de las primeras investigadoras que estudió el curso temporal de la resolución de anáforas 
ambiguas fue Gernsbacher (1989), quien utilizó tanto anáforas de repetición del nombre (no 
ambiguas), como anáforas pronominales ambiguas: 

Ana predijo que Eva perdería la carrera [1], pero Eva [2] llegó la primera con 

facilidad [3].[8a] 

Ana predijo que Eva perdería la carrera [1], pero ella [2] llegó la primera con 

facilidad [3].[8b] 
Cada oración se presentaba automáticamente palabra a palabra en el centro de la pantalla, y en 
un determinado momento aparecía una palabra de prueba en mayúsculas, que podía ser uno de 
los nombres «ANA» (referente) o «EVA» (no referente). La tarea de los participantes consistía 
en leer y comprender las oraciones y responder rápidamente ante la palabra de prueba si había 
aparecido en la oración leída hasta el momento. Así, se presentaba a los participantes en 
ocasiones la palabra «ANA» o la palabra «EVA» inmediatamente antes de la anáfora [1], 
inmediatamente después de la anáfora [2] o bien al final de la oración [3]. La lógica del 
experimento es que los tiempos de reacción para «ANA» y «EVA» en distintos puntos del 
texto nos indicarán la activación relativa de ambas palabras y. por lo tanto, en qué momento se 
resuelve el antecedente anafórico. Los resultados se resumen en la figura 8-4. 

: | En ambos tipos de oración, 
en la posición [1], antes de 
recibir la anáfora, tanto el 
referente como el no 
referente se verifican con 
idéntica rapidez, es decir, 


Referente (EVA) 


mu No re 


1,050 ferente (ANA) 1.050 


1.000 1.000 


950 


tempo (ms) 
Tiempo (ms) 
wo 


1 E 3 1 2 3 A 1 
Posición de la palabra de prueba Posición de la palabra de prueba estan igualmente 
A Anáfora de repetición (Eva) A Anáfora pronominal (ella) ' activados. Sin embargo, en 
Load Ens ad sc 
Figura 8-4. En la anáfora de repetición (A; el nombre del antecedente Eva se repite en la anáfora), la resolución es la anáfora de repetición en 


inmediata (posición 2), mientras que en la anáfora ambigua (B; el pronombre ella es compatible con dos posibles 
antecedentes) la resolución se aplaza hasta el final de la oración (posición 3). Tomado de Gernsbacher (1989). 
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inmediatamente después de recibir el nombre («EVA») el referente se verifica mucho más 
deprisa que el no referente, y este mismo patrón se observa en la posición [3], al final de la 
oración. Los resultados con la anáfora pronominal ambigua muestran, sin embargo, que en la 
posición [2] tanto el referente como el no referente se verifican igual de rápido, es decir que 
permanecen igualmente activados. Sólo en la posición [3], al final de la oración, se verifica 
más rápido el referente que el no referente. Hay dos observaciones importantes. En primer 
lugar, la ambigiedad referencial del pronombre no se resuelve inmediatamente, sino que se 
aplaza al final de la oración. En segundo lugar, cuando se resuelve el referente de la anáfora, 
no sólo se verifica más rápido el referente sino que se enlentece la respuesta ante el no 
referente (compárese con los tiempos de respuesta en la posición 1 antes de presentarse la 
anáfora). En otras palabras, Gernsbacher postula que hay dos procesos que operan en la 
resolución anafórica: el ensalzado del referente (aumento de activación) y la supresión o 
inhibición del no referente. 
En general, los pronombres anafóricos se refieren a un antecedente, con el que mantienen 
concordancia gramatical en género y número. Precisamente esa concordancia gramatical 
constituye una pista para resolver el antecedente. Hay una excepción a esto: las anáforas 
conceptuales. En los ejemplos que se muestran en la tabla 8-1, los antecedentes están escritos 
en singular y, sin embargo, sus respectivas anáforas son pronombres que están en plural y, por 
lo tanto, son gramaticalmente erróneos. 
Lo interesante, sin embargo, es que estas anáforas son 
conceptualmente correctas. En efecto, en algunos 
tea aaa estudios se comprobó que los lectores aceptan las 
una serie de objetos los tienes en la cocina. anáforas conceptuales, e incluso las prefieren a las 


Antecedente Anáfora conceptual 


repetidos , . , ; 

anáforas gramaticalmente más correctas. En el primer 
Categoría genérica Voy a pedir una pizza : : 

mati Sa le ejemplo, los interlocutores saben que los platos 
que más me gustan aparecen agrupados en la cocina, aunque sólo necesiten 
Entidad que incluye La profesora pidió uno. En el segundo ejemplo, la afición del hablante por 

a un colectivo silencio al grupo . ] . . 
revoltoso. Ellos no la pizza margarita no se refiere a una concreta, sino a 


le hicieron ni caso ; : 
todas las pizzas de este tipo. En el tercer caso, el 


nombre colectivo grupo evoca un conjunto de individuos, de modo que el plural es 
inmediatamente aceptable. 
En una serie de experimentos, Gernsbacher (1991) presentó a los lectores los tres tipos de 
anáforas conceptuales mencionados, pero incluyendo también condiciones de control. Por 
ejemplo, las anáforas singulares con antecedente colectivo se comparaban con otras 
condiciones posibles: 
Individuo singular: La profesora ordenó silencio al estudiante revoltoso. El no le hizo 
ni caso. [9a] 
Individuo plural: La profesora ordenó silencio al estudiante revoltoso. Ellos no le 
hicieron ni caso. [9b] 
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Colectivo singular: La profesora ordenó silencio al grupo revoltoso. El no le hizo ni 

caso. [9c] 

Colectivo plural: La profesora ordenó silencio al grupo revoltoso. Ellos no le hicieron 

ni caso. [9d] 
En todos los casos se registraron los tiempos de lectura de la segunda cláusula y, como cabía 
esperar, la condición agramatical «individuo plural» [9b] se leyó más lentamente (media = 
3.650 ms) que la condición «individuo singular» [9a] (M = 3.490 ms). Sin embargo, la 
condición «colectivo plural» [9d], es decir la anáfora conceptual, se leyó incluso más deprisa 
(M = 3.320 ms) que la condición «colectivo singular» [9c], gramaticalmente más correcta (M 
= 3.550 ms). Además, los lectores juzgaron más natural la condición «colectivo plural» que la 
«colectivo singular». 
A diferencia del inglés, en castellano es muy común emplear la anáfora cero en lugar de un 
pronombre. En realidad la denominación «anáfora cero» es inexacta, ya que la rica morfología 
de los verbos en castellano proporciona información sobre la persona y el número, que permite 
en muchos casos desvelar el referente. Por este motivo, el uso de pronombres anafóricos puede 
resultar redundante. El experimento de anáforas conceptuales se repitió en castellano, 
empleando anáforas cero, y los resultados fueron esencialmente idénticos a los obtenidos por 
Gernsbacher con pronombres anafóricos en inglés (Carreiras y Gernsbacher, 1992). Así, se 
leía más rápido y se juzgaba más natural «tengo que llamar de nuevo a Telefónica. Se 
equivocaron en la factura» que «tengo que llamar de nuevo a Telefónica. Se equivocó en la 
factura». 
Con frecuencia, en un texto se introduce un personaje con el nombre de su rol o profesión 
(profesor, enfermera, futbolista, etc.) y posteriormente se vuelve a mencionar mediante una 
anáfora. Por ejemplo: «El profesor explicó a sus alumnos la historia de los cartagineses. El 
produjo sopor en la audiencia». En inglés muchos nombres de profesión no tienen marca de 
género; por ejemplo 'the teacher' es la misma palabra para referirse a un profesor o a una 
profesora. Este hecho proporciona la ocasión de investigar los estereotipos de género, ya que 
hay algunas actividades o profesiones asociadas a los hombres y otras asociadas a las mujeres. 
Por ejemplo, 'the electrician' es una actividad más característica de los hombres, y 'the nurse' lo 
es de las mujeres. 
En un experimento realizado en inglés (Carreiras, Garnham, Oakhill y Cain, 1996), los 
participantes leían pares de oraciones, la primera de las cuales mencionaba un nombre de 
profesión, sin marca de género en inglés, y la segunda remencionaba el nombre utilizando un 
pronombre anafórico masculino o femenino. Los tiempos de lectura de la oración anafórica 
indicaron que, en efecto, los lectores mostraban inmediatamente un sesgo de género, a pesar de 
que no se les pedía ningún juicio explícito sobre éste. Así, leían más despacio [10b] cuando la 
oración incluía el pronombre 'she' (ella) que cuando incluía 'he' (él), puesto que 'electrician es 
un oficio asociado a hombres. Por el contrario, en [11b] leían más rápido la versión con 'she' 
(ella) que la versión con 'he' (él), ya que 'nurse' es una actividad asociada a mujeres. Las 
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anáforas en masculino y en femenino se leían igual de rápido cuando el referente era una 
profesión neutra, asociada igualmente a hombres y mujeres [12b]. 

'The electrician examined the light fitting'. (El-La electricista examinó la lámpara.) 

[10a] 

'He/She needed a special attachment to fix it'. (EVEIla necesitaba una pieza especial 

para poder arreglarla.) [10b] 

'The nurse put the injection to the patient'. (El-La enfermero-a puso la inyección al 

paciente.) [11a] 

'Then he/she changed her bandage. (Entonces él/ella le cambió el vendaje.) [11b] 

'The psychologist studied the students' test results'. (El-La psicólogo-a estudiaba los 

resultados de los estudiantes en los tests.) [12a] 

'He/She was concerned about the low standard". (EVE lla se preocupó por su bajo rendi- 

miento.) [12b] 
Los mismos autores realizaron un experimento análogo al anterior, traduciendo las oraciones 
al castellano. A diferencia del inglés, en esta lengua, los nombres de profesión tienen una 
marca de género en el propio nombre (camarero/camarera) o, al menos, en el artículo (p. ej., 
podemos decir «el electricista» O «la electricista»). Los resultados del nuevo experimento 
mostraron, también entre los lectores en lengua castellana, el estereotipo de género, pero éste 
no se manifestó en la anáfora de la segunda cláusula (el/ella), sino antes, en el propio nombre 
de profesión. Es decir, leían más lentamente «la electricista examinó la lámpara» y «el 
enfermero puso la inyección al paciente» (en contra del estereotipo) que «el electricista 
examinó la lámpara» y «la enfermera puso la inyección al paciente» (a favor del estereotipo). 

* Conectores 

Los conectores son otro tipo de marcadores lingiísticos, que funcionan como un «pegamento 
semántico» entre las cláusulas. Al igual que las anáforas, operan como instrucciones de pro- 
cesamiento (Givón, 1992), indicando al lector u oyente cómo debe integrar dos cláusulas. Los 
conectores de uso más frecuente (conjunciones O adverbios) son los aditivos temporales, 
causales y adversativos. Veamos algunos ejemplos: 

Hacía calor, y no tenía agua en la nevera (relación aditiva). [13a] 

Le robaron la ropa, mientras se bañaba en la playa (relación temporal). [13b] 

Se fue a la playa porque hacía calor (relación causal). [13c] 

No quiso ir a la playa, aunque hacía mucho calor (relación adversativa). [13d] 
Una primera observación es que los conectores operan entre unidades relativamente 
complejas, por lo general cláusulas u oraciones. Ello constituye una diferencia importante con 
las anáforas, que son meros punteros que señalan un concepto nominal previamente 
mencionado. Por otra parte, los conectores no se limitan a indicar que existe una relación 
formal (p. ej., sintáctica) entre dos unidades lingiísticas, sino que inducen al lector a construir 
un tipo de relación semántica particular entre dos eventos. Así, en los ejemplos anteriores, la 
relación temporal en [13b] es completamente diferente de la relación causal sugerida en [13c], 
que, a su vez, difiere de la relación adversativa indicada en [13d]. Los conectores aditivos, por 
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su parte, imponen muchas menos restricciones semánticas que los anteriores, siendo más 
polisémicos o de propósito general. Así, el conector y, dependiendo del contexto, puede 
entenderse como una simple yuxtaposición o enumeración de eventos, como sucesión 
temporal, causalidad e, incluso, contraste u Oposición entre eventos. Los conectores más 
restrictivos (es decir, adversativos y causales) son cognitivamente más demandantes que los 
menos restrictivos. Prueba de ello es que el orden de adquisición de los conectores en los niños 
es el siguiente: aditivos — temporales —> causales — adversativos (p. ej., Carón, 1997). 

La frecuencia de uso de los conectores es muy alta, tanto en el lenguaje oral como en el escrito. 
En la tabla 8-2 se recogen algunos datos estadísticos sobre el uso de los conectores más 
comunes, tanto en el lenguaje escrito como en el oral. 


Corpus Corpus Para valorar mejor estos datos, piénsese que las frecuencias 


Conecior oral escrito vpo . z 
en el corpus escrito de los pronombres «él» y «ella», son 

Pero 5.447 3.729  Adversativo e . - 
Por 5069 EP 2.725 y 2.974 por millón, respectivamente. Es decir, que la 
Aunque 476 750 Adversativo/ frecuencia de algumos conectores es del mismo orden de 

concesivo 
Como 1500 5024 Causallmodal Magnitud e, incluso, superior (véase el conector aditivo «y» 
Y 21.652, 25:434  Kditivo en la tabla 8-2), que el de los pronombres anafóricos más 
Para 5.736 4.440 Instrumental, 

final comunes. 
- 4691 2431 Disyuntvo Pese a la evidencia de los datos estadísticos anteriores, los 
Si 4.120 2.577 Condicional UN ) , ' 
Cuando 2022 2642 Temporal conectores son la Cenicienta de la psicología del lenguaje. 
Q5ta id 147 Explicativo Su papel ha sido marginado en gran medida en las teorías de 
Luego 1.275 679  Consecutivo, a . . 

temporal la Comprensión del lenguaje y, en consecuencia, las 
Es decir 779 90  Explicativo 


investigaciones sobre conectores son bastante escasas. En 
ocasiones, los conectores han sido más un tema de estudio 
de los psicólogos del razonamiento, que han considerado que algunos de ellos («y», «luego», 
«pero», «0», «si») son operadores lógicos incorporados en el lenguaje natural. Por lo tanto, 
según estos investigadores, habría que explicar su uso en las tareas de razonamiento deductivo. 


Tomado de de Vega, 2005. 


Este descuido por parte de la psicología del lenguaje es sorprendente si lo comparamos, por 
ejemplo, con la abundancia de estudios sobre las funciones cognitivas de las anáforas, 
descritas en el apartado anterior. 
El primer estudio sobre el funcionamiento cognitivo de los conectores fue desarrollado por 
Millis y Just (1994). Simplemente manipularon la presencia o ausencia del conector «porque» 
en oraciones con contenido o sesgo causal. Por ejemplo: 
Los padres brindaron por su única hija durante la cena [porque] Juana había superado 
los exámenes finales en una prestigiosa universidad. [14] 
Los lectores se autoadministraban el texto palabra a palabra, mediante la técnica de la ventana 
móvil (Recuadro 8-3). Los resultados mostraron tiempos de lectura ligeramente más rápidos 
en cada palabra de la segunda cláusula de [14] cuando se había insertado «porque» que cuando 
se quitaba, lo cual indica que la presencia del conector reduce la carga cognitiva en la lectura. 
Sin embargo, la pauta se invirtió en la última palabra de la oración (universidad), en la cual la 
lectura fue más lenta en presencia del conector que en su ausencia. 
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Recuadro 8-3. La técnica de la ventana móvil 


El registro de los movimientos oculares durante la lectura es el mejor método para analizar en 
línea los procesos de lectura, dado que se mide el tiempo que el ojo se detiene en cada palabra o 
segmento de la oración. Sin embargo, esta técnica requiere un equipamiento caro y un análisis de 
datos lento y costoso. Una técnica alternativa más barata y fácil de aplicar es la ventana móvil, 
ilustrada más abajo. Sólo se necesita un ordenador programado adecuadamente. El participante 
recibe inicialmente en la pantalla una serie de máscaras que ocultan las palabras de la oración 
(1). Para leer ésta, simplemente debe apretar una tecla y, cada vez que lo hace, se desvela una 
palabra en el lugar de la máscara correspondiente, y la palabra anterior vuelve a enmascararse 
(2-5). De ahí la impresión visual de una ventana que se desplaza. 


1 2 3 4 5 


> nd >. > oe = > 1 Fi o a En > 
| III | El LAIA II | II reloj 1111 11111111 | IF 1111) está 1111111 | IMM aasdo 

El lector se familiariza rápidamente con el procedimiento y lee a su propio ritmo, mientras el 
ordenador registra el tiempo que ha permanecido cada palabra en pantalla. Lo interesante es que 
los tiempos de lectura de las palabras reflejan el costo cognitivo de cada una. Así, las palabras 


más largas, las menos frecuentes y las que requieren realizar alguna operación cognitiva adicio- 
nal se leen más lentamente. 


Más adelante se hará referencia a este curioso resultado. Después de haber leído cada oración, 
como medida de la activación en la memoria se les presentaba a los lectores una palabra de 
prueba que debían identificar como perteneciente o no al texto leído. En los ensayos positivos, 
esta palabra de prueba pertenecía a la primera cláusula (p. ej., «brindaron» o a la segunda 
cláusula (p. ej., «superado»). La identificación de la palabra de prueba fue más rápida en 
presencia del conector, indicando que éste inducía una reactivación de la primera cláusula. 
Otros investigaciones han mostrado, además, que la presencia del conector causal «porque» 
incrementa la probabilidad de recuerdo tanto de la primera como de la segunda cláusula de las 
oraciones. 

Es importante señalar que el conector «porque» no incluye información específica sobre cómo 
es la relación causal existente entre los eventos. Únicamente le indica al lector que debe inferir 
una relación causal apropiada para ese contexto. En la mayoría de las situaciones el autor del 
texto es cooperativo al insertar un «porque» entre dos eventos causalmente relacionados y el 
lector tiene éxito al establecer la relación causal, basándose en su conocimiento del mundo. 
Por ejemplo, al leer [15a], nuestro conocimiento implícito de las leyes físicas y de otros 
episodios o situaciones similares nos permiten inferir el vínculo causal señalado por el 
conector (la pelota golpeó el jarrón). Sin embargo, un texto gramaticalmente idéntico con el 
mismo conector, como es el caso de [15b], puede resultar absurdo o difícil de comprender 
porque el lector no puede generar una representación situacional que justifique un vínculo 
causal: 

El jarrón se rompió, porque Luisito estaba jugando a la pelota en el salón. [15a] 
El río se desbordó, porque Luisito estaba jugando a la pelota en el salón. [15b] 

De hecho, Noordman, Vonk y Kempff (1992) comprobaron que cuando el lector no dispone de 
suficiente conocimiento sobre el fundamento causal de dos eventos, el conector «porque» 
resulta completamente inútil puesto que el lector no es capaz de realizar la inferencia causal. 
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Por ejemplo, un grupo de lectores expertos y novatos en economía recibieron el siguiente 
texto: 

En los últimos meses las exportaciones norteamericanas han sufrido una caída, porque 

el aumento de la inflación ha producido efectos perjudiciales en la competitividad de 

EE.UU.[16] 
Los resultados mostraron que los expertos en economía realizaron la inferencia causal 
señalada por el conector (la competitividad de un país tiene gran influencia en el volumen de 
sus exportaciones), mientras que los novatos no lo hicieron. 
Los conectores adversativos, por su parte, indican al lector que debe estar preparado para una 
ruptura de sus expectativas causales en la siguiente cláusula. En otras palabras, son indi- 
cadores de discontinuidad entre las cláusulas. Su presencia también parece tener un efecto fa- 
cilitador en la lectura. En un estudio desarrollado por de Vega (2005) se comparó el efecto de 
la presencia o ausencia de los conectores, tanto causales como adversativos, en oraciones que 
compartían las dos últimas cláusulas, como se muestra a continuación: 

Sesgo causal: El montañero tuvo mala suerte al trepar a lo alto de la montaña [porque] 

al llegar se torció un tobillo. Tuvieron que ayudarle a bajar entre varios. [17a] 

Sesgo adversativo: El montañero estaba en forma al trepar a lo alto de la montaña 

[pero] al llegar se torció un tobillo. Tuvieron que ayudarle a bajar entre varios. [17b] 
Los participantes se autoadministraban los segmentos del texto (grupos de dos o tres palabras) 
apretando una tecla. El ordenador registraba los tiempos de lectura de cada segmento, 
especialmente de la segunda cláusula y de la oración siguiente. En general, como se aprecia en 
la figura 8-5, la presencia de un conector, sea en un contexto causal o en un contexto 
adversativo, acelera la lectura del texto, con una excepción notable: como ocurrió en el 
experimento de Millis y Just (1994), mencionado antes, al final de la segunda cláusula («un 
tobillo») se produce un incremento del tiempo de lectura en presencia del conector. Este 
repunte del tiempo de lectura es atribuible a que, justo al final de la oración, el lector ejecuta la 
«instrucción» del conector, es decir, construye el vínculo causal o adversativo entre ambas 
cláusulas, lo cual requiere recursos adicionales. 


1.800 Presente 
1.600 "m Ausente 


1.400 
1.200 
1.000 


Tiempo (ms) 
00 
[e] 
o 


Adversativo Causal Adversativo Causal Adversativo Causal 
Sesgo de la oración Sesgo de la oración Sesgo de la oración 
A «Al bajar se torció... B un tobillo» Cc «Tuvieron que ayudarle 


a bajar entre varios» 


Figura 8-5. Tiempos de lectura de varios segmentos de texto en las condiciones de conector presente o ausente. 
Tomado de de Vega (2005). 
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Los resultados de la figura 8-5 muestran que los efectos de presencia o ausencia de conector 
son prácticamente idénticos en las oraciones causales y en las adversativas. Ello podría 
inducirnos a pensar que es indiferente utilizar uno u otro conector. Para comprobar si esto es 
así, se realizó otro experimento en el que cada oración (causal o adversativa) incluía un 
conector apropiado o inapropiado. Por ejemplo: 

Sesgo causal: El montañero tuvo mala suerte al trepar a lo alto de la montaña, 

[porque] [pero] al llegar se torció un tobillo. Tuvieron que ayudarle a bajar entre 

varios. [18a] 

Sesgo adversativo: El montañero estaba en forma al trepar a lo alto de la montaña, 

[porque] [pero] llegar se torció un tobillo. Tuvieron que ayudarle a bajar entre varios. 

[18b] 
Los tiempos de lectura se incrementaron considerablemente en las condiciones de conector 
inapropiado (sesgo causal-conector «pero», y sesgo adversativo-conector «porque»), en 
relación a las condiciones de conector apropiado. Esto indica que los conectores no son 
intercambiables. Al igual que una llave sólo abre la cerradura apropiada, debe haber un ajuste 
semántico entre el conector elegido y el contenido de las cláusulas que vincula para que la 
comprensión tenga éxito. 
En definitiva, anáforas y conectores son dos tipos de marcadores gramaticales que indican al 
lector u oyente cómo mantener la correferencia entre cláusulas próximas. Ambos mecanismos 
del lenguaje son fundamentales para que el lector u oyente regule la activación de algunos 
conceptos durante la lectura. Así, cuando se resuelve el antecedente de una anáfora, éste se 
mantiene activado en la memoria de trabajo, mientras que los nombres competidores se 
inhiben. Igualmente, la presencia de un conector apropiado reactiva los eventos mencionados 
en la cláusula anterior. Más allá de la regulación de activación, las anáforas y los conectores 
implican muchas veces sutiles procesos semánticos. Por ejemplo, la resolución de anáforas es 
sensible a nuestro conocimiento del mundo (p. ej., anáfora conceptual) e incluso a nuestros 
estereotipos de género. Por su parte, algunos conectores, como los causales y los adversativos, 
tienen una fuerte carga semántica ellos mismos, al inducir al lector u oyente a construir 
vínculos causales, basándose en su conocimiento del mundo. 


PERSPECTIVA SEMÁNTICA Y PRAGMÁTICA 

Hasta ahora se han considerado algunos hechos importantes referidos a la comprensión de 
oraciones, relacionados sobre todo con la gramática. Al comprender una oración, la 
segmentamos en sus componentes gramaticales y utilizamos las anáforas y conectores para 
establecer vínculos entre segmentos o cláusulas de una oración. Aunque muchos 
investigadores han intentado abordar el procesamiento gramatical de forma aséptica, como si 
se tratase de un proceso independiente del significado, hemos visto que no siempre lo 
lograron. Nuestro conocimiento del mundo influye en algún momento en la segmentación 
sintáctica y, como acabamos de mencionar, el procesamiento de anáforas y conectores también 
requiere a veces que apliquemos inferencias basadas en ese mismo conocimiento del mundo. 
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A continuación se abordarán algunos fenómenos notables relacionados con la comprensión de 
oraciones, que implican un uso aun más activo de nuestro conocimiento del mundo. 

+ Más allá de las palabras: significado corpóreo 

Un tema fundamental de la psicología del lenguaje es el de la representación del significado. 
Esta cuestión se ha desarrollado ampliamente en el capítulo 7, al abordar el significado de las 
palabras. Volveremos sobre ella en el capítulo 9, dedicado al significado del discurso, pero 
aquí debemos llamar la atención sobre algunos aspectos relacionados con el significado en el 
nivel de oraciones: 

+ Elsignificado es referencial: no sólo representamos las palabras y las oraciones sino que 
también elaboramos un modelo de la situación al que aquellas se refieren. 

+ En algunos casos las oraciones se refieren a situaciones concretas, como experiencias 
visuales («el ordenador está sobre la silla»), auditivas («Marta escucha una salsa»), 
motoras («Luis lanzó la pelota»), olfativas («notó el olor de los pinos») o emocionales 
(«Marta vio morir a su perro fiel»). 

+ Algunas investigaciones sugieren que la comprensión de estos tipos de oraciones 
moviliza representaciones corpóreas, es decir, que incluyen aspectos visuales, motores, 
etc., de la situación. 

+ Como consecuencia de estas investigaciones, las teorías corpóreas consideran que la 
comprensión de oraciones implica simulaciones sensoriomotoras de los eventos, y estas 
simulaciones constituyen un aspecto fundamental del significado lingúístico. Veamos 
algunos estudios en este Campo. 

La comprensión de oraciones que describen objetos activa representaciones visuales. 
Estos estudios indican que, en la comprensión de oraciones, los individuos activan imágenes 
visuales, que incluyen la orientación espacial, la posición y la forma de los objetos. En el 
paradigma experimental básico se presenta a los participantes una oración seguida de un 
dibujo, con instrucciones de indicar rápidamente si el objeto del dibujo se mencionó en la 
oración. Por ejemplo, en un estudio de Stanfield y Zwaan (2001) se presentaban oraciones del 
tipo «Juan metió el lápiz en el cajón» o bien «Juan metió el lápiz en el vaso» y, a continuación, 
el dibujo de un lápiz en posición horizontal o en posición vertical. La verificación 
oración-dibujo fue más rápida cuando la orientación de éste era coincidente con el significado 
de la oración («lápiz en el cajón» y dibujo de lápiz horizontal, o «lápiz en el vaso» y dibujo del 
lápiz vertical) que cuando no lo era («lápiz en el vaso» y dibujo horizontal, o «lápiz en el 
cajón» y dibujo vertical). Igualmente, cuando se presentaron oraciones que incluían objetos 
que pueden tener diferentes formas dependiendo de su estado, se observó un efecto análogo de 
coincidencia en el paradigma de verificación oración-dibujo (Fig. 8-6). Así, el dibujo de un 
águila con las alas abiertas se verificaba más deprisa en el contexto [19a] que en [19b], 
mientras que un águila con las alas plegadas se verificaba más rápido en [19d] que en [19c] 
(Zwaan, Stanfield y Yaxley, 2002). 
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La comprensión de oraciones referidas a acciones activa 
representaciones motoras. Un modo de comprobar si el 
lenguaje de acción implica procesos motores es utilizar 


Pg paradigmas de doble tarea, en los cuales los participantes 


El biólogo vio al águila en el cielo [19a] 


El biólogo vio al águila en el nido [190] deben comprender oraciones referidas a acciones, al 
mismo tiempo que realizan ellos mismos una acción 
motora, que es similar (compatible) o diferente 
(incompatible) con la mencionada en la oración. La 

hd lógica de este procedimiento es que si existe interacción 
Mo Ag o pil A E (facilitación o bien interferencia) entre el significado de 
a corea) 1 Oieción y la ejecución de la acción, ello indicaría que 
Zwaan, Stanfield y Yaxley (2002). ambos comparten procesos motores. Este paradigma, 
denominado también de compatibilidad oración-acción (COA), fue ideado por Glenberg y 
Kaschak (2002), quienes presentaban a los participantes oraciones que describían un 
movimiento de transferencia hacia sí mismo («Raúl te entregó la pizza») o hacia otro («tú le 
entregaste la pizza a Raúl»). También había oraciones de relleno absurdas («Mónica te cantó 


un reloj)» necesarias para la tarea. Esta consistía en que los participantes debían juzgar en cada 


El biólogo vio al águila en el cielo [19c] 


oración si tenía sentido o no. La mitad de los participantes respondían «sí» moviendo una 
palanca hacia delante, y la otra mitad respondía «sí» moviendo la palanca hacia atrás. Las 
respuestas «sí» fueron más rápidas en las condiciones en que la dirección del movimiento 
motor y la dirección de la transferencia coincidían («transferencia hacia otro-movimiento 
adelante» y «transferencia hacia sí mismo-movimiento atrás»), que en caso contrario 
(«transferencia hacia otro-movimiento atrás» y «transferencia hacia sí mismo-movimiento 
adelante»). Curiosamente, los efectos de compatibilidad oración-acción existieron también en 
las oraciones abstractas, es decir aquellas que mencionaban transferencias no de objetos 
físicos, sino de información; por ejemplo, «tú le contaste a Luisa la historia» o «Juan te explicó 
la lección». Esto supone que algunos conceptos abstractos también tienen un componente 
motor, pero, por otra parte, también sugiere que la representación motora subyacente es muy 
genérica: un movimiento del cuerpo hacia delante o hacia atrás, sin especificar qué efectores 
concretos intervienen. 

El mismo paradigma COA fue empleado también por Zwaan y Taylor (2006), quienes 
utilizaron oraciones referidas a acciones que implican un giro de la mano hacia la derecha 
(«Luis está afilando el lápiz») o hacia la izquierda («Claudia bajó el volumen de la radio»). Al 
igual que en el estudio anterior, había también oraciones de relleno absurdas. Los participantes 
escuchaban estas oraciones y juzgaban si tenían o no sentido, girando un botón a la derecha o a 
la izquierda. De nuevo observaron que las respuestas «sí» fueron más rápidas cuando la 
dirección de giro coincidía con la de la acción descrita, que en el caso contrario. 

En general, los estudios de COA muestran un efecto de facilitación entre significado y acción 
cuando ambos implican acciones similares o compatibles. Sin embargo, éste no es siempre el 
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caso. En una investigación desarrollada por de Vega, Moreno y Castillo (2013), el 
procedimiento experimental difería algo del estándar. 
La pelota de tenis se la lancé al contrario sóbrela... [21a] 
La pelota de tenis me la lanzó el contrario sóbrela... [21b] 

Los participantes leían oraciones incompletas de transferencia hacia otro [21a] o hacia sí 
mismo [21b], presentadas palabra a palabra automáticamente. Cuando aparecía el verbo de 
transferencia («lancé» o «lanzó»), tras un intervalo corto (200 ms) o largo (350 ms), se 
presentaba un indicio visual sobre la acción motora que debían ejecutar. Por ejemplo, el propio 
verbo se desplazaba visualmente, simulando un movimiento de alejamiento o acercamiento, 
para indicarle al lector que debía mover el dedo índice en la misma dirección y apretar una de 
las teclas alternativas, registrándose el tiempo de respuesta. Como en los anteriores 
experimentos, el movimiento era coincidente o no con el significado de transferencia de la 
oración. Los resultados sobre la respuesta motora dependieron del momento en que se les 
presentaba el indicio de ejecución. Cuando éste ocurría 200 ms después de la aparición del 
verbo, se producía más interferencia (respuesta más lenta) en las condiciones de 
compatibilidad significado-acción («transferencia adelante-acción adelante» y «transferencia 
atrás-acción atrás») que en las condiciones de incompatibilidad. Esto sugiere que en los 
momentos iniciales la simulación del significado de las oraciones de transferencia y la 
ejecución casi al mismo tiempo de una acción similar compiten por los mismos recursos 
neuronales del sistema motor. En cambio, si el movimiento tardaba más en iniciarse (indicio 
visual a los 350 ms), se producía facilitación en las condiciones de compatibilidad, sugiriendo 
que después de la representación motora inicial se producía un priming semántico en las 
condiciones compatibles. 

Las investigaciones con técnicas de neurociencia, especialmente las imágenes de resonancia 
magnética funcional (RMf), han mostrado que la comprensión de oraciones de acción activa 
regiones de la corteza motora y premotora que son específicas del tipo de acción mencionada. 
Tettamanti et al. (2005) registraron la actividad cerebral de un grupo de participantes mediante 
dicha técnica mientras escuchaban oraciones relativas a movimientos de la boca («muerdo una 
manzana»), de las manos («cojo un cuchillo») o de las piernas («doy una patada al balón»). 
Como condición de control se utilizaron oraciones con contenido abstracto («aprecio la 
sinceridad»). Los resultados mostraron que una región específica de la corteza frontal inferior 
izquierda (pars opercularis u opérculo central) se activaba en todas las oraciones con verbos de 
acción, pero no en las oraciones abstractas. Esta región, que pertenece al área de Broca, se ha 
relacionado con la planificación y observación de acciones motoras. Pero, además, las 
oraciones con verbos de movimiento de la boca, las manos o las piernas activaban otras áreas 
específicas de la corteza motora, relacionadas con la ejecución de los movimientos 
correspondientes. Estos resultados sugieren que estas oraciones activan una representación 
relativamente abstracta de las acciones (pars opercularis), pero también activan en cierta 
medida programas motores específicos. Más aun, estas áreas específicas se solapan 
parcialmente con las que se activan cuando observamos acciones de la boca, las manos o las 
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piernas. En otras palabras, en la comprensión del lenguaje de acción podrían estar implicadas 
las denominadas neuronas espejo (Recuadro 8-4 y Fig. 8-7). 


Recuadro 8-4. Lenguaje y neuronas espejo 


Uno de los descubrimientos más espectaculares de las neurociencias en las últimas décadas 
es el de las neuronas espejo (mirror neurons), llevado a cabo por un grupo de investigadores de 
la universidad italiana de Parma, encabezado por Giacomo Rizzolatti. 

Rizzolatti y sus colegas implantaron inicialmente microelectrodos en neuronas específicas 
de la corteza premotora en el cerebro de macacos. Como cabía esperar, se registró actividad en 
algunas de estas neuronas cada vez que el animal realizaba un movimiento, por ejemplo, al cerrar 
una mano. Pero fue una auténtica sorpresa comprobar que esas mismas neuronas se activaban 
también cuando el animal observaba un movimiento análogo del investigador o de otro primate. 
Es fácil suponer que estas neuronas podrían estar relacionadas con la conducta imitativa, pero 


también con la capacidad de comprensión de las 
acciones e intenciones de los demás e incluso con 
la empatía emocional. 


Parte del sistema de neuronas espejo (SNE) en 
los macacos (área F5) coincide aproximadamente 
con el área de Broca en los seres humanos, espe- 
cializada en la producción del lenguaje pero tam- 
bién en la planificación, observación y control de 
las acciones. Otras neuronas espejo en el cerebro 
humano se hallan distribuidas en la corteza parie- 
tal inferior y en la corteza temporal superior (Fig. 
8-7). Rizzolattti y Arbib (1998) postulan que el 
propio lenguaje humano es una extensión del SNE 
que amplió sus funciones desde la observación e 
interpretación de las acciones a las formas sofis- 
ticadas de comunicación humana. Lo que sí pare- 
ce estar más claro es que parte del SNE interviene 
tanto en la comprensión de acciones observadas 
como en la comprensión del lenguaje de acción. 


Corteza 
premotora (CPM) ventral/ 
circunvolución frontal 
inferior (CFI) posterior 


Lóbulo parietal 
inferior (LPI) rostral 


Surco temporal 
superior (STS) posterior 


Figura 8-7. Sistema de neuronas espejo en el 
cerebro humano. El STS posterior proporciona el 
input visual al SNE propiamente dicho (LPI ros- 
tral, CPM ventral y CFl posterior). 


La comprensión de oraciones activa expresiones faciales. Un aspecto importante del lenguaje 
humano es que puede describir emociones, más aun, también puede provocarlas. Pensemos, 
por ejemplo, en el impacto emocional que puede tener en el oyente una expresión de halago, 
un insulto o una mala noticia. Algunos investigadores han tratado de valorar si la comprensión 
de oraciones activa procesos emocionales, fijándose en una de sus manifestaciones 
fisiológicas: las expresiones faciales. Havas, Glenberg y Rinck (2007) presentaron a los 
participantes oraciones relativas a eventos de valencia positiva (p. ej., «tú y tu pareja os 
abrazáis después de una larga separación») o de valencia negativa (p. ej., «el coche de la 
policía te sigue a gran velocidad haciendo sonar la sirena»). La tarea de los participantes era 
juzgar cada oración como agradable o desagradable, apretando una de las dos teclas asignadas. 
La mitad de los participantes debía mantener durante el experimento un lápiz entre los dientes, 
forzando una mueca parecida a una sonrisa, y la otra mitad un lápiz entre los labios, forzando 
una expresión de preocupación como se muestra en la figura 8-8. La manipulación de la 
expresión facial era encubierta, ya que a los participantes se les indicaba que la finalidad de 
mantener el lápiz era evitar la articulación vocal. Los tiempos de respuesta agradable/ 
desagradable claramente indican un efecto de compatibilidad, como se observa en el gráfico 
de la figura 8-8: la expresión de preocupación (lápiz en los labios) produce una respuesta más 
lenta para los contenidos agradables que la sonrisa (lápiz en los dientes), y la pauta se invierte 
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para los contenidos desagradables. Los autores argumentan que durante la comprensión de 
oraciones los lectores simulan la emoción implícita, empleando los mecanismos cerebrales 
correspondientes, que incluyen la expresión facial apropiada. Cuando la expresión forzada en 
el experimento es de valencia diferente a la de la oración, se obstaculiza la simulación 
emocional y se produce dificultad de comprensión. 


Posición del lápiz 


Labios Dientes 


2.740 


Labios 
2.720 mu Dientes 


Tiempo (ms) 


Agradable Desagradable 
Valencia de oración 


Figura 8-8. Influencia de la expresión facial al comprender oraciones de contenido emocional. Los lectores man- 
tenían un lápiz entre los labios o entre los dientes, forzando una expresión preocupada o alegre, respectivamente. 
La forma de sostener el lápiz influyó sobre los tiempos de respuesta en los juicios sobre oraciones de valencia 
agradable o desagradable, como se aprecia en el gráfico. Tomado de Havas et al. (2007). 
Quizá la demostración más convincente de que las expresiones faciales tienen un papel 
funcional en la comprensión de oraciones emocionales procede de otro experimento de Havas 
et al. (2010). En él participaron mujeres que recibían un tratamiento antiarrugas en una clínica 
cosmética. El tratamiento consistió en la inyección subcutánea de toxina botulínica, 
paralizante, en los músculos del entrecejo (corrugado res). El experimento se desarrolló en dos 
sesiones: una antes del tratamiento y otra después. En cada sesión las participantes leyeron 
oraciones relativas a situaciones de ira (p. ej., «harto de discutir con aquel cabezota intolerante, 
te fuiste dando un portazo»), situaciones de pena (p. ej., «contuviste tus lágrimas al entrar en la 
sala del funeral») o situaciones alegres (p. ej., «subes corriendo las escaleras del apartamento 
de tu amor»). Se registraron los tiempos de lectura como variable dependiente y se comprobó 
que la velocidad lectora de las oraciones alegres no había variado entre ambas sesiones. Sin 
embargo, la lectura fue más lenta tras el tratamiento con toxina botulínica tanto en las 
oraciones tristes como en las de enfado. Es decir, la parálisis de los músculos del entrecejo, que 
intervienen en la expresión de emociones negativas como enfado y pena, dificulta la 
comprensión de oraciones que implican dichas emociones, sugiriendo que la simulación 
emocional es necesaria para la comprensión. 
+ Más allá del lenguaje literal: las metáforas 
Las metáforas son expresiones semánticamente híbridas: por lo general se refieren a ideas 
abstractas, pero utilizan para ello palabras concretas. Por ejemplo, muchas metáforas se 
refieren a estados mentales, a relaciones interpersonales e incluso a conceptos científicos 
abstractos, utilizando términos relativos al mundo físico o sensoriomotor. Así: 
Su pensamiento era un torbellino. 
La recibieron calurosamente en su pueblo. 
Mis relaciones con ella se han enfriado mucho. 
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María arrastró a su novio a la fiesta. 

La mente humana es un ordenador. 

La vida es un relámpago en la noche. 
Las metáforas son literalmente falsas. En los ejemplos anteriores, ni el pensamiento es un 
torbellino, ni las relaciones humanas tienen que ver con la temperatura; con seguridad María 
no arrastró físicamente a su novio (probablemente lo obligó con argumentos o amenazas); la 
mente humana es un maravilloso sistema biológico pero desde luego no es un ordenador y, 
pese a la belleza de la expresión shakesperiana, la vida no tiene nada que ver con los 
relámpagos. Quizás, estas «inexactitudes» provocaron la mala prensa que las metáforas han 
tenido durante mucho tiempo entre los filósofos, los lingúistas y los psicólogos. 
Tradicionalmente han sido consideradas como expresiones «bonitas» más propias de poetas 
que de científicos, y de interés marginal para la psicología y la lingúística: una especie de 
aberraciones semánticas, muy inferiores a las expresiones literales. Este estado de opinión, sin 
embargo, ha cambiado radicalmente en los últimos 30 años, y el estudio cognitivo de la 
metáfora se ha convertido en un campo boyante de investigación, abordado por psicólogos, 
lingúistas, neurocientíficos y expertos en computación. Varios hechos destacables han contri- 
buido a esta rehabilitación de la metáfora como objeto de estudio. 
En primer lugar, las metáforas son muy frecuentes. Las empleamos continuamente en la vida 
diaria, por lo que deben de tener una funcionalidad psicológica importante. A partir del 
análisis de entrevistas psicoterapéuticas y discursos presidenciales, se ha calculado que 
utilizamos 5 ó 6 metáforas por cada minuto de conversación (Pollio, Barlow, Fine y Pollio, 
1977). Lo que ocurre es que muchas de ellas, las denominadas metáforas muertas, pasan 
inadvertidas, ya que están tan fuertemente arraigadas en nuestros hábitos lingúísticos que no 
producen ninguna «tensión metafórica». Por ejemplo, las metáforas de temperatura empleadas 
para describir las relaciones entre las personas son tan comunes que no producen ninguna 
sorpresa. Sólo cuando oímos o producimos metáforas vivas o nuevas, como las que suelen 
utilizar los grandes poetas, tenemos la impresión de disonancia semántica o tensión metafórica 
que contribuye seguramente a la impresión estética. 
En segundo lugar, las metáforas son herramientas de colonización cognitiva. Los lingiiistas 
cognitivos Lakoff y Johnson publicaron en 1980 el libro Metaphors we Uve by, que tuvo un 
gran impacto en nuestra comprensión e investigación de las metáforas. En él proponen que las 
metáforas no son únicamente modos de hablar, sino más bien modos de pensar. Nuestro 
sistema conceptual se organiza de modo metafórico. Así, las denominadas metáforas 
orientacionales constituyen un rico sistema conceptual organizado en torno a las dimensiones 
del espacio. Por ejemplo, algunas nociones abstractas, como el bien, la virtud, la alegría, la 
conciencia, la salud, la riqueza, el alto estatus, el poder, etc., se sitúan metafóricamente en el 
polo «arriba» de la dimensión vertical, mientras que las nociones opuestas (el mal, el vicio, la 
tristeza, la inconsciencia, la enfermedad, la pobreza, el bajo estatus, etc.) se sitúan en el polo 
«abajo» de la dimensión vertical, como se muestra en la tabla 8-3. 
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Tabla 8-3. Ejemplos de metáforas orientacionales en la dimensión vertical 


Arriba Abajo 


+ Mi espíritu se eleva con la música 
e Ha ascendido a la cumbre del poder 
+ Con este aprobado se me ha subido la moral 


Después del fracaso se ha hundido 


Cayó en un pesado sopor 


Su saludo está declinando 


» Los banqueros se han subido el salario + Está bajando de nuevo la bolsa 
e Ella ha escalado hasta la dirección de la empresa + Ha bajado varios escalones en la empresa 
+ Juan tiene a su novia en lo alto de un pedestal + Con tu conducta estás cayendo muy bajo 


Su rendimiento en los estudios ha bajado mucho 


De este modo se produce una auténtica colonización cognitiva, al mapear un dominio de 
conocimiento abstracto e intangible en una dimensión física como es la vertical. 
En tercer lugar, las metáforas pueden ser generativas, es decir, pueden guiar nuestro 
comportamiento. Cuando decimos o pensamos que «el tiempo es oro» (o en inglés 'time is 
money”), no se trata de una figura retórica sin mayores consecuencias. Tendemos a emplear 
nuestro tiempo de modo análogo a como utilizamos un recurso material escaso y valioso. No 
«malgastamos» el tiempo, ni lo «perdemos», ni lo «regalamos»; lo «medimos» 
minuciosamente, y lo «distribuimos» del modo más eficaz cual si fuéramos contables, 
preparando un presupuesto. En ocasiones, el efecto generativo de las metáforas puede ser 
incluso dramático. Los sentimientos y las conductas hostiles hacia las minorías se alimentan a 
veces de metáforas, del tipo «los miembros de la comunidad X son auténticas ratas» O «los 
miembros de la comunidad Z son parásitos». 
En los últimos años se han desarrollado diversas teorías cognitivas y computacionales sobre la 
comprensión de las metáforas, que aquí, por razones de espacio, no se desarrollarán. En 
cambio, sí se mencionarán algunos experimentos representativos que tratan de fundamentar la 
comprensión de las metáforas en los procesos sensoriomotores. La idea que subyace a estos 
estudios es que las metáforas no son convenciones lingúísticas arbitrarias sino que, en algunos 
casos, su significado metafórico activa realmente procesos corpóreos. Por ejemplo, la com- 
prensión de metáforas orientacionales como las descritas por Lakoff y Johnson (1980), que se 
muestran en la tabla 8-3, podría activar en línea procesos motores en la dimensión vertical del 
espacio. Para verificar esta hipótesis, Santana y de Vega (2011) utilizaron un procedimiento 
tipo COA, en una tarea de comprensión de metáforas orientacionales. Los participantes leían 
frases de tres tipos: 
Literales espaciales: 

- La gran hélice hizo elevarse el helicóptero. 

- El peso del lastre hizo descender al buzo. Metáforas espaciales: 

- Su talento le hizo alzarse con la victoria. 

- Sudivorcio le hizo caer en la depresión. Abstractas no espaciales: 

- Su entusiasmo le hizo triunfar en la profesión. 

- Las discusiones hicieron fracasar su matrimonio. 
Las palabras de cada frase se presentaban de una en una automáticamente en el centro de la 
pantalla; cuando llegaba el verbo de la oración, los participantes recibían un indicio de 
movimiento hacia arriba o hacia abajo, y debían mover lo más rápidamente posible la mano en 
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la dirección indicada, para apretar la tecla asignada en la parte superior o inferior de un tablero 
situado verticalmente. Los resultados indicaron respuestas más rápidas en las condiciones de 
compatibilidad que en las de incompatibilidad, tanto en las oraciones literales como en las 
metáforas. Más notable, incluso, fue que las frases totalmente abstractas interactuaban del 
mismo modo con el movimiento vertical de la mano, como se puede apreciar en la figura 8-9. 


820 Literal Metáfora Abstracta 
Dirección 

800 de la oración 
780 ma Arriba 
N Abajo 
E 760 
a 
£ 740 
109] 
a 720 

700 

680 

Arriba Abajo Arriba Abajo Arriba Abajo 
Dirección del movimiento 


Figura 8-9. Tiempo de reacción en las respuestas motoras en función del tipo de oración (literal, metáfora o 
abstracta), la dirección asociada al significado de la oración (arriba/abajo) y la dirección del movimiento (arriba/ 
abajo). Tomado de Santana y de Vega (2011). 


Formalmente, dichas frases no son metáforas, ya que utilizan verbos abstractos, como 
«triunfar» o «fracasar», en lugar de verbos de movimiento, como «caer» o «elevarse», pero 
aun así se comportaron como metáforas. La explicación a este enigma nos la proporciona la 
propia teoría de Lakoff y Johnson (1980): las metáforas son conceptuales, y las nociones 
abstractas de triunfo y fracaso pertenecen al mismo sistema metafórico arriba-abajo, incluso 
aunque las expresamos literalmente. 
No sólo la dimensión vertical es un organizador de metáforas conceptuales, también las 
dimensiones horizontales lo son. Así, tendemos a representar el futuro situado delante y el 
pasado situado detrás, al menos en castellano y en otras lenguas indoeuropeas. Sell y Kaschak 
(2010) utilizaron el mismo paradigma COA empleado por Glenberg y Kaschak (2002), para 
comprobar si esta conceptualización metafórica «tiempo como espacio» tiene realmente un 
carácter corpóreo. Los participantes leían oraciones, que describían un salto temporal hacia el 
futuro [20a] o bien hacia el pasado [20b] y debían juzgar si eran coherentes o no. Como de 
costumbre, algunos participantes respondían «sí» con un movimiento hacia delante y otros 
respondían «sí» con un movimiento hacia atrás para apretar una determinada tecla. 

Carol está yendo a clase de pintura. El próximo mes estudiará el uso de los pinceles. 

[20a] 

Carol está yendo a clase de pintura. El mes pasado estudió el uso de los pinceles. 

[20b] 
Como se esperaba, los participantes que respondían moviendo el dedo hacia delante para 
indicar «sí» fueron más rápidos al juzgar las oraciones de tipo [20a], y los que respondían «sí» 
moviendo el dedo hacia atrás lo fueron en las oraciones de tipo [20b]. Es decir, el tiempo fluye 
de atrás hacia delante, en un sentido corpóreo muy concreto. 
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Por otra parte, el tiempo también se organiza sobre la dimensión espacial izquierda-derecha 
según han demostrado Santiago, Lupiáñez, Pérez y Funes (2007). Estos investigadores 
presentaron verbos en la pantalla del ordenador a los participantes, quienes debían juzgar 
rápidamente si estaban en pasado o en futuro. Algunos participantes debían responder 
«pasado» apretando la tecla izquierda, y «futuro» apretando la tecla derecha, pero a otros 
participantes se les asignaba las teclas de respuesta a la inversa: pasado = tecla derecha y 
futuro = tecla izquierda. Estos últimos respondieron más lentamente que los primeros, lo cual 
sugiere que, metafóricamente, el tiempo también fluye de izquierda a derecha. Los dos tipos de 
metáforas temporales son, probablemente, de origen muy distinto. Representarse el tiempo 
fluyendo de atrás adelante quizá tenga que ver con la dirección de la marcha: las metas no 
alcanzadas (futuras) suelen estar delante, y las metas superadas (pasadas) suelen quedar detrás. 
En cambio, situar el pasado a la izquierda y el futuro a la derecha parece más bien fruto de un 
artefacto cultural: leemos y escribimos de izquierda a derecha. De hecho, los árabes y los 
hebreos se representan el flujo del tiempo de derecha a izquierda, dadas las características de 
su sistema de escritura. Otra diferencia sustancial es que se han acuñado expresiones 
lingúísticas para la metáfora del tiempo como fluyendo de atrás adelante, mientras que no 
existen tales expresiones para el tiempo como fluyendo de izquierda a derecha. En ambos 
casos tenemos una conceptualización metafórica del tiempo como espacio, pero sólo en el 
primero la conceptualización penetra el sistema lingiístico produciendo oraciones 
metafóricas. Así, decimos «más adelante haré la tesis doctoral» o «atrás quedan los años de mi 
niñez», pero nadie dice «más a la derecha haré la tesis doctoral» ni «a la izquierda quedan los 
años de mi niñez». 
+ Más allá de los hechos: oraciones negativas y contrafactuales 

Uno podría pensar que el lenguaje humano surgió en nuestros antepasados como una 
herramienta funcional para comunicar hechos: cómo crear y usar herramientas, cómo seguir 
rutas, cómo cooperar en la caza, etc. Esta comunicación factual era, sin duda, importante para 
nuestros antepasados, como lo sigue siendo para nosotros. Pero, además, los seres humanos 
somos una especie «mentalista», y por ello estamos motivados y capacitados para expresar 
diversos estados de irrealidad. Es más, la propia lengua dispone de recursos sintácticos y 
morfológicos para expresar estos estados, tal es el caso de las oraciones negativas y 
contrafactuales. 

Ambos tipos de oraciones han sido estudiadas tradicionalmente por los lógicos y los 
psicólogos del razonamiento, dado que tienen la propiedad de alterar los valores de verdad de 
los enunciados. Por ejemplo, la oración afirmativa «un gorrión es un pájaro» es verdadera, 
mientra que su negación «un gorrión no es un pájaro» es falsa. A la inversa, la afirmación «un 
gorrión es un mamífero» es falsa, mientras que su negación «un gorrión no es un mamífero» es 
verdadera. Del mismo modo, la oración contra-factual «si hubiera ido al restaurante habría 
visto a Laura», describe una situación hipotética cuyos valores de verdad ofrecen matices 
sutiles, en relación a su versión afirmativa. En primer lugar, las oraciones contrafactuales 
describen eventos irreales (no he ido al restaurante ni he visto a Laura), pero, además, 
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proponen una relación condicional que puede ser verdadera o falsa. La alteración de los 
valores de verdad de las premisas cuando están en forma negativa o contrafactual tiene 
consecuencias importantes en el razonamiento deductivo. 
La negación 
A los psicólogos del lenguaje también les interesa la negación, pero no sólo por el modo en que 
altera los valores de verdad, sino también por algunas de sus características pragmáticas y 
cognitivas. Veamos algunos ejemplos de negaciones y sus funciones. Una negación como «un 
gorrión no es un mamífero» se basa en nuestros conocimientos prealmacenados en la memoria 
semántica; para verificarla no tenemos que realizar ninguna valoración directa en el mundo 
real, basta con comprobar que no existe ningún vínculo directo entre los conceptos «gorrión» y 
«mamífero» para concluir que la negación es verdadera. En cambio, la negación «el coche de 
Luis no tiene gasolina» sólo se puede verificar en un contexto episódico particular. La 
dimensión pragmática de las negaciones es muy importante: ¿por qué surge la necesidad de 
negar algo? Sin duda porque los interlocutores parten de algún supuesto previo. Así, las 
negaciones episódicas requieren que el lector u oyente asuma un supuesto previo (p. ej., los 
coches generalmente tienen gasolina), en el que adquieren valor informativo. En ocasiones, los 
supuestos en que se basa la negación son, a su vez, muy contextúales y requieren un 
conocimiento episódico compartido entre los interlocutores. Por ejemplo, supongamos que 
Juana le dice a su pareja Pablo: «no estoy embarazada»; esta negación sólo será inteligible si 
Juana y Pablo sospechaban previamente un posible embarazo. En caso contrario, Pablo podría 
quedar desconcertado y decir: «ah... no sabía que creías estar embarazada». Por último, 
consideremos la negación «¡no cojas ese libro!; se trata de un imperativo cuyo objetivo en un 
contexto real sería inducir al oyente a inhibir una acción que iba a realizar. Probablemente, esta 
función pragmática de la negación es la más primitiva desde el punto de vista evolutivo, ya que 
los bebés comprenden muy tempranamente la negación imperativa. 
Una investigación pionera sobre la comprensión en línea de las negaciones fue desarrollada 
por MacDonald y Just (1989), quienes presentaron a los participantes oraciones como las si- 
guientes: 

Todos los fines de semana, Alicia no cocina pan sino galletas para los niños. [21a] 

Todos los fines de semana, Alicia cocina pan pero no galletas para los niños. 

[21b] 

Todos los fines de semana, Alicia cocina pan y galletas para los niños. [21c] 
Como puede apreciarse, el concepto negado era el nombre 1 («pan» en [21aJ), el nombre 2 
(«galletas» en [21b]) o no había negación alguna [21c]. Tras leer cada oración, los 
participantes recibían una palabra de prueba, que en los ítems experimentales era el nombre 1 
o el nombre 2. Los tiempos de reconocimiento de la palabra de prueba se muestran en la figura 
8-10. Como puede verse, el nombre negado siempre se verificaba más lentamente que el no 
negado. 
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Nombre 1 negado | El estudio de McDonald y Just demostró con mucha 
"E Nombre 2 negado 


1.100 mn Sin negación nitidez que la negación es un reductor de activación. En 
di opinión de los autores, esto ocurre porque la negación 


E sy cambia el foco del discurso, desviándolo del concepto 
5 an ' negado. Esta es una aportación importante, pero quedan 
Eso otras cuestiones por resolver, entre ellas ¿cómo se 
800 representa la información negada? La respuesta 
al la tradicional, procedente de la lógica formal pero bastante 


Palabra de prueba 


popular en psicología, es que la negación es un operador 
figura 8-10. Tiempos de reconocimiento de la pala- simbólico que se aplica sobre la representación 


bra de prueba (nombre 1 o nombre 2) en función de la 


negación. Los tiempos más lentos de los nombres ne- Droposicional de la oración, ejerciendo un efecto de 


gados indican el efecto de la negación como reductor 


de activación. Tomado de MacDonald y Just (1989)... reducción de activación. Por ejemplo, la oración «Alicia 


cocina pan pero no galletas» se representaría proposicionalmente: «cocina [Alicia, pan] y NO 
[cocina (Alicia, galletas)]». Por lo tanto, el concepto «galletas» resultará menos accesible que 
el concepto «pan», simplemente porque está incluido en una proposición afectada por el 
operador negativo. 
Sin embargo, otra posible explicación de este resultado podría ser que la negación afecta al 
modelo de situación. Es decir, el lector se representa la situación descrita con un objeto 
presente (el afirmado) y otro ausente (el negado) y, en consecuencia, este último resulta menos 
accesible en la tarea de verificación de la palabra de prueba porque simplemente «no está» en 
la situación. Barbara Kaup y sus colaboradores investigaron esta posibilidad. En un estudio 
desarrollado por Kaup y Zwaan (2003) se presentaban a los participantes cuatro tipos de 
oraciones: 

Marcos sintió alivio porque Laura se había puesto el vestido rosa. (Afirmación, objeto 

presente.) [22a] 

Marcos hubiera preferido que Laura no se pusiese el vestido rosa. (Negación, objeto 

presente.) [22b] 

Marcos hubiera preferido que Laura se pusiese el vestido rosa. (Afirmación, objeto 

ausente.) [22c] 

Marcos sintió alivio porque Laura no se puso el vestido rosa. (Negación objeto, 

ausente.) [22d] 
El experimento utilizó oraciones afirmativas [22a y 22c] y negativas [22b y 22d], pero, 
independientemente de la forma gramatical, estas oraciones podían describir un objeto (el 
vestido rosa) presente en la situación [22a y 22b] o ausente en la situación [22c y 22d]. La 
palabra de prueba era el nombre del color del objeto (rosa) y se presentaba tras un intervalo de 
500 ms o de 1.500 ms después de haber leído la oración. Los resultados a los 500 ms mostraron 
que la negación ejercía un efecto indiscriminado de reducción de activación: «rosa» se 
verificaba más lentamente en las oraciones negativas [22b y 22d], que en las afirmativas [22a y 
22c]. Sin embargo, al cabo de 1.500 ms la activación dependía de la presencia del objeto en la 
situación. Así, la respuesta era más rápida en [22a] y en [22b], en las que el vestido rosa está 
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presente, que en las otras versiones. El experimento indica un doble proceso en la comprensión 
de negaciones: en una primera etapa predomina el mecanismo gramatical de reducción de 
activación propio de la negación, propuesto por MacDonald y Just, pero más tarde la 
activación dependerá del estatus, presente o ausente, del objeto en el modelo de situación. 
Los estudios neurocientíficos también impulsaron recientemente el estudio de las negaciones, 
tratando de desvelar cómo modulan los procesos cerebrales en contraste con los enunciados 
afirmativos. Por ejemplo, Tettamanti et al. (2008) desarrollaron un estudio con RMf en el que 
se registraban los cambios hemodinámicos del cerebro durante la comprensión de oraciones. 
Los participantes oían oraciones relativas a acciones manuales en forma afirmativa o negativa 
(«ahora pulso el botón» o «ahora no pulso el botón»), y oraciones abstractas también 
afirmativas o negativas («ahora aprecio la lealtad» o «ahora no aprecio la lealtad»). Los 
resultados mostraron actividad en la corteza motora y premotora (áreas frontoparietales) 
durante la comprensión de oraciones de acción afirmativas, en comparación con las oraciones 
abstractas afirmativas. Sin embargo, cuando se analizaron las oraciones de acción negativas, 
se constató una reducción de actividad en esas mismas áreas motoras, indicando que la nega- 
ción bloquea las representaciones motoras asociadas al lenguaje de acción. 

Las oraciones contrafactuales 

Las personas utilizamos expresiones contrafactuales para hacer conjeturas acerca de eventos 
pasados que podrían haber sido de otro modo. Por ejemplo, «si Jaime hubiera estudiado la 
última semana, habría aprobado el examen». Expresar enunciados contrafactuales parece un 
ejercicio estéril, ya que los eventos pasados fueron como fueron y no se pueden cambiar. En el 
ejemplo anterior, está claro que Jaime no estudió la última semana y no aprobó el examen. Sin 
embargo, utilizamos constantemente oraciones contrafactuales, a veces expresándolos 
abiertamente y a veces como pensamientos rumiados internamente («hum... tenía que haber 
pedido descafeinado, ahora ya es tarde»). Las expresiones contrafactuales son una 
manifestación de nuestras sofisticadas capacidades representacionales, que nos permiten 
valorar los eventos ya ocurridos, contrastándolos con sus alternativas hipotéticas. Además, 
según han revelado los psicólogos sociales, tenemos buenos motivos para hacerlo, ya que las 
expresiones contrafactuales desempeñan múltiples roles en la vida cotidiana, como ayudar a 
establecer vínculos causales, aprender a partir de los errores, favorecer la toma de decisiones, 
persuadir al interlocutor, etc. (véase revisión de Róese, 2005). Además, las oraciones 
contrafactuales están relacionadas con algunas emociones humanas complejas, como el pesar 
o el alivio que resultan de contrastar lo que ocurrió con lo que podría haber ocurrido. 

Lo que aquí nos interesa es el punto de vista del lector u oyente: cómo se comprenden las 
oraciones contrafactuales. Una característica señalada por varios autores es su significado dual 
(Róese, 2005; Byrne, 2005). Así, cuando entendemos [23] nos representamos dos modelos de 
situación: una situación realista en la que María no compró el boleto ni ganó el premio, es decir 
una doble negación (no-p y no-q), y una situación hipotética en la que María compró el boleto 


y ganó el premio (p y q). 
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Si María hubiera comprado aquel boleto de lotería, habría ganado un premio 
millonario. [23] 
La complejidad semántica de las expresiones contrafactuales fue estudiada inicialmente por 
los psicólogos del razonamiento. Por ejemplo, Santamaría, Espino y Byrne (2005) presentaban 
a los participantes oraciones condicionales contrafactuales o factuales como las siguientes: 

Si hubiera habido rosas entonces habría habido lilas (contrafactual). [24a] 

Si hay rosas, entonces hay lilas (factual). [24b] 
Después de cada oración seguía otra oración de consecuencia que podía ser afirmativa («había 
rosas y había lilas») o negativa («no había rosas y no había lilas»). Los participantes que 
habían recibido el condicional contrafactual [24a] aceptaban como continuación válida tanto 
la versión afirmativa como la negativa, mientras que los que habían recibido el condicional 
factual [24b] sólo aceptaban la continuación afirmativa. Los resultados sugieren el doble 
significado de las oraciones contrafactuales. 
Un estudio reciente trató de comprobar si las oraciones contrafactuales pueden provocar 
representaciones corpóreas al igual que las factuales. Así, de Vega y Urrutia (2011) emplearon 
un paradigma COA con oraciones de transferencia en formato factual («como mi hermano es 
generoso, la novela me la ha prestado sin vacilar») o contrafactual («si mi hermano hubiera 
sido generoso, la novela me la habría prestado sin vacilar»). Los lectores debían ejecutar un 
movimiento de la mano hacia delante o hacia atrás ante un indicio presentado 200 ms después 
de la presentación del verbo («prestado»). Los resultados mostraron interferencia cuando la 
transferencia y la acción motora eran coincidentes, hecho que ocurrió tanto en las oraciones 
factuales como en las contrafactuales. Por lo tanto, las oraciones contrafactuales, a pesar de su 
carácter hipotético, parecen inducir representaciones motoras cuando describen acciones. 
Las oraciones contrafactuales son utilizadas en ocasiones para inducir líneas de pensamiento 
hipotéticas que chocan con la realidad. Por ejemplo, «si Hitler hubiera ganado la guerra, 
entonces...». A partir de premisas contrafactuales como ésta se pueden escribir libros enteros 
(¡y de hecho se hace!). Pero volviendo a la perspectiva del lector, ¿en qué medida éste se 
adapta al mundo hipotético planteado por un contrafactual que viola nuestro conocimiento del 
mundo? Ferguson y Sanford (2008) presentaron a los participantes oraciones como las 
siguientes mientras registraban sus movimientos oculares durante su lectura. 

Si los gatos están hambrientos, el amo podría alimentarlos con un plato de zanahorias. 

(Antecedente factual, consecuente en conflicto.) [25a] 

Si los gatos fueran vegetarianos, el amo podría alimentarlos con un plato de 

zanahorias. (Antecedente contrafactual, consecuente en conflicto.) [25b] 

Si los gatos están hambrientos, el amo podría alimentarlos con un plato de pescado 

(Antecedente factual, consecuente sin conflicto.) [25c] 
En [25 a] se plantea un antecedente factual y el consecuente entra en conflicto con el 
conocimiento del mundo. En [25b] el consecuente también entra en conflicto con el 
conocimiento del mundo, pero es aceptable asumiendo la premisa contrafactual (si los gatos 
fueran vegetarianos). Los resultados mostraron que en un primer momento la lectura del 
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segmento «con un plato de zanahorias» requería más tiempo en [25a] y [25b] que el segmento 
«con un plato de pescado» en [25c], no habiendo diferencias entre las dos primeras 
condiciones. Es decir, el lector de un enunciado contrafactual no puede evitar inicialmente que 
su conocimiento del mundo (los gatos no son vegetarianos) interfiera. Sin embargo, cuando se 
registraron las regresiones visuales (cuando los ojos vuelven atrás para releer), sólo la 
condición [25a] produjo regresiones, no habiendo diferencias entre [25b] y [25d]. Esto indica 
que, finalmente, el antecedente contrafactual ha sido asumido por el lector y la información en 
conflicto con la realidad se ha integrado en un nuevo modelo de situación, correspondiente al 
mundo hipotético. 
* Conclusiones 

En esta última parte del capítulo hemos abordado las complejidades del significado de la 
oración. Hemos comprobado que, además de procesar el código lingiiístico, segmentando las 
oraciones y estableciendo vínculos de correferencia entre los nombres y las cláusulas, el lector 
u oyente tiene que usar recursos cognitivos, pragmáticos y neuronales variados para establecer 
el significado de la oración. En ocasiones activará mecanismos sensoriomotores o corpóreos 
que van más allá del propio código lingúístico; también utilizará un sistema conceptual que en 
parte tiene una organización metafórica y, finalmente, empleará conocimientos contextúales y 
pragmáticos para comprender enunciados irreales, como las oraciones negativas y las 
contrafactuales. 


RESUMEN 

+ Las oraciones, con su carácter predicativo (dicen algo sobre algo o alguien), 
constituyen las verdaderas unidades del significado lingúístico en contextos naturales. 
Los lingiiistas siempre han señalado que las oraciones tienen una organización formal o 
sintaxis y, más recientemente, los psicólogos del lenguaje han intentado demostrar la 
«realidad psicológica» de dicha sintaxis. 

»+ Basándose en la teoría estructural de Chomsky, han comprobado que los lectores u 
oyentes realizan una segmentación de las oraciones (parsing) en línea, utilizando 
ciertos principios de eficiencia, como el cierre tardío: «unir las nuevas unidades 
gramaticales a la cláusula o sintagma procesado más recientemente». Sin embargo, las 
investigaciones empíricas realizadas durante más de una década han obligado a revisar 
estos presupuestos de eficiencia, ya que han resultado no ser universales. 

+ El enfoque funcionalista de la sintaxis ha prestado especial atención a los marcadores 
de cohesión que funcionan como «instrucciones de procesamiento». Así, las anáforas le 
indican al lector u oyente qué concepto mencionado previamente debe mantenerse en el 
foco atencional, y los conectores instruyen al lector u oyente para que vincule 
conceptualmente dos cláusulas, por ejemplo, señalando una relación causal o 
adversativa entre los eventos. Finalmente, se han abordado algunos aspectos notables 
del significado de las oraciones: el hecho de que las oraciones referidas a experiencias 
sensoriales o motoras determinen representaciones corpóreas o sensoriomotoras, los 
procesos de comprensión de metáforas que establecen un vínculo analógico entre 
experiencias sensoriomotoras y conceptos abstractos y, finalmente, la comprensión de 
oraciones que niegan la existencia (negaciones) o que plantean alternativas hipotéticas 
(contrafactuales) de los eventos. 
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Preguntas de reflexión 
* ¿Qué quiere decir el principio de cierre tardío y cómo se aplica a las oraciones de 
relativo? 
* ¿Qué es una anáfora conceptual y cómo se investiga? 
+ ¿Por qué razón en castellano abundan las anáforas cero? 
+ ¿Cómo influye la presencia de un conector durante la lectura en línea? 
+ Busca ejemplos de metáforas orientacionales en las tres dimensiones del espacio. 
+ ¿Por qué se dice que las negaciones reducen la activación? 
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Comprensión del discurso 


Objetivos de aprendizaje 
Al finalizar el capítulo el alumno será capaz de: 
e Distinguir las peculiaridades del discurso oral y del discurso escrito. 
e Entender los fenómenos propios del discurso: coherencia, inferencias, niveles de 
representación y modelos de situación. 
e Conocer las investigaciones con métodos en línea sobre las dimensiones espaciales, 
temporales, emocionales e interpersonales de los modelos de situación. 
e Conocer y valorar las teorías sobre la comprensión del discurso. 


INTRODUCCIÓN 

El discurso consiste en un conjunto de oraciones que mantienen una unidad de sentido o 
coherencia. La psicología del discurso es en gran medida la psicología de la complejidad. En la 
comprensión del discurso se amalgaman los procesos analizados en los capítulos anteriores 
relacionados con las palabras y las oraciones, procesos que ya son complejos en sí mismos. 
Pero hay más: el lector u oyente del discurso debe combinar el significado de múltiples ora- 
ciones, establecer la coherencia entre ellas, extraer las ideas principales o realizar inferencias 
aplicando su conocimiento del mundo y, todo ello se realiza de forma inmediata a medida que 
se procesan las palabras del discurso, es decir, «en línea». Como veremos, esto implica enor- 
mes desafíos para el sistema cognitivo humano. 

Discurso oral y discurso escrito. El discurso es una forma natural del lenguaje que se 
produce tanto en el habla como en la escritura. Cuando alguien cuenta un relato, describe un 
episodio de su vida, comenta una noticia, da una charla en público, explica un argumento, etc., 
todas ellas son formas de discurso oral. Los ejemplos mencionados son formas de monólogo, 
pero incluso la conversación informal entre dos o más interlocutores es también discurso oral. 
En la conversación, los interlocutores se intercambian oraciones, pero no azarosamente sino 
que deben mantener cierta coherencia discursiva para que la comunicación sea posible. La 
conversación es un complejo ejercicio cognitivo, ya que los interlocutores deben alternar los 
procesos de comprensión y de producción del habla y, además, tener en cuenta lo que dice el 
otro, todo ello en línea y con poco tiempo para planificar. En el recuadro 9-1 se describen estas 
dificultades, y en el capítulo 10 se volverán a tratar con más amplitud los procesos conver- 
sacionales. 


Recuadro 9-1. La conversación: una forma de discurso oral 


Lo primero que llama la atención a los estudiosos de la conversación o diálogo es su enorme 
complejidad cognitiva. Lo segundo que llama la atención es la facilidad con que 
conversamos. En un artículo titulado Why is conversation so easy?, Garrod y Pickering 
(2004) señalan, entre otras, las siguientes dificultades en la conversación: 

* Las expresiones son muchas veces elípticas y fragmentarias (p. ej., «bueno, ya sabes... ella 
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fue quien... bueno también lo hizo con ayuda de Marta»). Hay relativamente pocas oraciones 
completas y bien formadas. 

* La planificación es oportunista, ya que no podemos predecir con mucha antelación cómo se 
desarrollará la conversación. Por ejemplo, el interlocutor puede preguntarnos algo inesperado 
que debemos contestar. 

* Lo que decimos debe ajustarse al estado de conocimiento del interlocutor. Así, podemos 
referirnos a «mi vecino Arturo», si el interlocutor conoce a varios «Arturos» y queremos 
especificar a cuál nos referimos; hablaremos de «Arturo» cuando el interlocutor sabe de 
antemano a quién nos referimos y utilizaremos simplemente «él» cuando Arturo ya ha sido 
mencionado anteriormente. 

* Problemas de interfaz: debemos decidir cuándo es oportuno iniciar nuestra intervención 
-generalmente medio segundo antes de que termine nuestro interlocutor- planeando lo que 
vamos a decir mientras todavía escuchamos. 

+ Realizamos frecuentes cambios de tarea (hablar frente a escuchar), y todo cambio de tarea 
supone coste cognitivo adicional. 

A pesar de todo, conversar o dialogar es fácil. En opinión de Garrod y Pickering, lo es porque 
los interlocutores realizan una tarea cooperativa: construyen conjuntamente la conversación. 
Para facilitar esta actividad cooperativa, se produce un alineamiento interactivo, 
generalmente automático e inconsciente, entre los interlocutores en varios niveles de 
representación: 

* Modelos de situación: los interlocutores comparten sus representaciones situacionales, es 
decir hablan del mismo lugar, mismo tiempo, mismos personajes, etc., incluso cuando 
debaten o no están de acuerdo. 

+ Semántica, sintaxis y fonética: los interlocutores tienden a utilizar las mismas palabras, 
construcciones gramaticales y fonéticas, reutilizando muchas veces las frases que acaban de 
escuchar. 

El alineamiento interactivo utiliza no sólo recursos cognitivos y lingúísticos, sino también 
motores. Los interlocutores tienden a alinear sus posturas, entonación, gestos, etc., quizás em- 
pleando sus sistemas de neuronas espejo. 


Por su parte, el discurso escrito o texto tiene, generalmente, un carácter más formal y cuidado 
que el discurso oral. Por ejemplo, las oraciones están bien formadas y la estructura y los 
detalles del texto han sido habitualmente planificados, documentados, revisados y corregidos 
antes de su forma definitiva. Por parte del lector, la tarea de comprensión del texto también 
ofrece características diferentes de la comprensión del discurso oral. Por ejemplo, el lector no 
dispone de información contextual directa, mientras que el oyente suele compartir situación 
con quien produce el discurso. 

Textos narrativos y textos expositivos. Hay una gran variedad de textos, que implican 
géneros y funciones muy diversas. Sin embargo, los psicólogos del lenguaje suelen hacer una 
distinción gruesa entre textos narrativos y textos expositivos, que corresponden a dos formas 
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típicas del pensamiento y de la comunicación humana, cuyas características se resumen en la 
tabla 9-1. 


Tabla 9-1. Diferencias entre textos narrativos y textos expositivos 


Textos narrativos Textos expositivos 
Descripción Situaciones y episodios Ideas, argumentos, demostraciones, datos, etc. 
Contenidos Personales: personajes, acciones, Impersonales 
intenciones, emociones, conflictos 
y relaciones 
Organización Espacial, temporal, causal y motivacional Conceptual o lógica 
Finalidad Entretener, emocionar, divertir, etc. Instruir, enseñar, informar, persuadir, etc. 


Los textos expositivos son productos culturales, generalmente asociados a la exposición de 
conocimientos técnicos, científicos o de otro tipo (manuales, tratados, artículos, ensayos, etc.), 
que suelen utilizarse como herramientas de aprendizaje. Este tipo de textos no es simplemente 
para «leer» sino para estudiar. Por este motivo, su investigación reviste especial interés para 
los pedagogos, los psicólogos educativos o los psicólogos instruccionales”. 


T ur a : A 

Hay textos híbridos con componentes expositivos y narrativos, como ocurre, por ejemplo, con los textos de 
historia, que pueden incluir crónicas (esencialmente narrativas) y explicaciones abstractas (expositivas) 
basadas en variables económicas, ecológicas, etcétera. 


En este capítulo nos centraremos casi exclusivamente en la comprensión de los textos 
narrativos, durante la lectura en línea, por su especial interés psicológico. Los textos narrativos 
están próximos a la comunicación humana más básica, por ejemplo a los relatos orales o a las 
conversaciones. Al igual que éstos, las narraciones frecuentemente describen episodios que 
incluyen a personas que interactúan entre sí, tienen intenciones y metas, afrontan problemas u 
obstáculos, sienten emociones, etc. Además, la información tanto en los relatos orales como en 
los textos narrativos se organiza temporal, espacial y causalmente. Por estas razones, estudiar 
la comprensión de textos narrativos permite tener una visión bastante aproximada de los 
procesos de comprensión del discurso en general. 

Ciertamente, las narraciones de la literatura son, en general, productos lingúísticos de una 
complejidad y originalidad muy superiores a la comunicación oral espontánea. De entrada, en 
la conversación cara a cara, los interlocutores comparten experiencias perceptivas, lo cual les 
permite referirse directamente a ellas mediante expresiones deícticas. Por el contrario, el autor 
de un texto narrativo y el lector no comparten situación, ni tampoco pueden observar 
directamente el mundo narrativo descrito. Esto obliga al autor a proporcionar multitud de 
detalles explícitos, y al lector a hacer un esfuerzo adicional para reconstruir mentalmente las 
situaciones referidas. Por ejemplo, en una conversación podemos decir «mira este libro» y el 
entorno compartido, los gestos, miradas, etc., permiten especificar a quién nos dirigimos y a 
qué libro nos referimos. En un texto, en cambio, el autor tendría que aclarar muchos detalles 
mediante acotaciones; por ejemplo: «Mira este libro -le dijo Marta a Luis, señalando un grueso 
libro de historia que estaba sobre la mesa». 

Métodos. ¿Cómo investigar la comprensión de textos narrativos? Las narraciones literarias 
son demasiado extensas y complejas como para estudiarlas en el laboratorio. En lugar de ello, 
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los investigadores suelen construir microtextos (a veces denominados humorísticamente 
«textoides»), en los que manipulan una o unas pocas variables para estudiar aspectos concretos 
de la comprensión. Un buen ejemplo es un estudio clásico desarrollado por Bransford y 
Johnson (1972), quienes utilizaron micro textos como el siguiente: 
«La orilla del mar es mejor sitio que una calle. Al principio es mejor correr que 
caminar. Puede que tengas que intentarlo varias veces. Requiere bastante habilidad, 
pero es fácil de aprender. Incluso los niños pueden disfrutar con ello. Si tienes éxito, las 
complicaciones son mínimas. Los pájaros rara vez se acercan. Con la lluvia, sin 
embargo, se empapa rápidamente. Si hay mucha gente haciendo lo mismo esto puede 
causar problemas. Uno necesita mucho espacio. Si no hay complicaciones, es una 
actividad agradable. Una piedra puede servir como anclaje. Sin embargo, si se suelta 
no tendrás una segunda oportunidad.» 
El lector seguramente se encontrará algo desconcertado al leer este texto. Por una parte, el 
texto incluye palabras totalmente familiares, y sus oraciones están gramaticalmente bien 
construidas. Pero aun así, no está claro a qué se refiere exactamente. Ahora pongámosle un 
título: «Volando una cometa». Si el lector vuelve a leer el texto anterior, todo parecerá encajar 
y su comprensión resultará ahora fácil. Bransford y Johnson (1972) desarrollaron un 
experimento en el que algunos participantes recibían textos ambiguos como el del ejemplo, sin 
título alguno; a otros participantes se les proporcionaba el título antes de cada texto, y a Otros, 
por último, se les daba el título después de haber leído cada texto. Los que recibieron el título 
juzgaron que habían comprendido mejor los textos que los que no recibieron el título. Más 
importante: los que conocían el título antes de cada historia recordaron significativamente más 
contenidos, en una prueba de memoria, que los que no lo conocían y que aquellos que lo 
recibieron después de la historia. En suma, este estudio demuestra con una manipulación muy 
sencilla (presencia/ ausencia de título) aplicada a microtextos artificiales, que la comprensión 
del discurso va más allá del procesamiento de las palabras y de las oraciones individuales: 
requiere que el lector sea capaz de entender el sentido general del texto, es decir, debe ser 
capaz de construir modelos de situación apropiados. 
La mayoría de las investigaciones que se describirán en este capítulo utilizan también 
microtextos narrativos, manipulando una o más variables. Sin embargo, en lugar de emplear -o 
además de ello- tareas de memoria realizadas a posteriori como hicieron Bransford y Johnson 
(1972), la mayoría utiliza medidas en línea, como las que se han mencionado con respecto al 
estudio de las oraciones. Es decir, tratan de capturar los procesos de comprensión sobre la 
marcha. Un procedimiento es analizar los tiempos de lectura de las palabras u otras unidades 
del texto (sintagmas, cláusulas), mediante el registro de los movimientos oculares o la técnica 
de ventana móvil. Los tiempos de lectura nos dan una panorámica del coste cognitivo en cada 
momento de la lectura; así, los ojos se fijan más tiempo en las palabras que requieren procesos 
más complejos; por ejemplo, cuando el lector se encuentra una palabra poco familiar, cuando 
resuelve el antecedente de una anáfora ambigua, cuando realiza una inferencia o cuando se 
encuentra una incongruencia con el contexto previo. También se dedica más tiempo a la última 
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palabra de cada cláusula, oración o párrafo, indicando que el lector realiza operaciones 
adicionales de «empaquetado» de información al final de cada segmento gramatical. 
Finalmente, el lector puede volver los ojos atrás para releer porciones anteriores del texto, lo 
cual nos informa sobre las dificultades de comprensión en segmentos determinados del texto. 
También se utilizan profusamente medidas de activación intercaladas durante la lectura de un 
texto o bien al final de éste. Entre ellas son destacables la identificación de palabras, la tarea de 
decisión léxica o el nombrado de una palabra en voz alta. En la tarea de identificación se 
presenta una palabra de prueba, que el lector debe juzgar si estaba o no presente en el texto 
recién leído. Los tiempos de respuesta y la precisión de la respuesta indican el grado de 
activación o accesibilidad en la memoria a corto plazo de esa palabra o del concepto 
relacionado, en función de las variables manipuladas en el texto. Si en la condición 
experimental A se producen respuestas más rápidas a la palabra de prueba y con menos errores 
que en la condición B, ello indica mayor activación del concepto correspondiente en A que en 
B. La tarea de decisión léxica y el nombrado de palabras son técnicas que ya se han descrito en 
el capítulo 6 en relación con los fenómenos de priming. La diferencia es que en el estudio del 
discurso, el priming sobre la tarea de decisión léxica o el nombrado en voz alta lo determina el 
contexto discursivo, mientras que en los estudios mencionados en el capítulo 6 se trataba de un 
priming léxico. 


FENÓMENOS EMERGENTES EN EL DISCURSO 

Cada nivel de análisis en una disciplina científica ofrece al investigador sus propios 
fenómenos emergentes. Por ejemplo, en las ciencias biológicas hay disciplinas que van desde 
el estudio de los procesos en el interior de la célula (biología molecular, citología) hasta la 
interacción entre las especies y su ambiente (ecología). En la psicología del lenguaje, el 
estudio del procesamiento de las palabras incluye cuestiones como la percepción del habla, el 
reconocimiento de las palabras, su estructura morfológica, etc. En el estudio de la oración 
emergen los fenómenos del procesamiento sintáctico y el papel de los marcadores de cohesión. 
Por último, en el estudio del discurso surgen los fenómenos de coherencia, las inferencias y los 
modelos de situación. A estos fenómenos dedicaremos atención seguidamente. 

e Coherencia 

Solemos decir que un buen texto debe ser coherente. En realidad, la coherencia depende tanto 
de las características del texto (estructura, marcadores de cohesión) como de la actividad del 
lector. Un texto es, ciertamente, una estructura organizada que proporciona al lector indicios o 
pistas útiles para construir el significado, como las propias palabras seleccionadas en cada 
oración, el orden de las oraciones y, sobre todo, los denominados marcadores de cohesión, 
algunos de los cuales ya se han analizado en el capítulo 8: las anáforas y los conecto res. Una 
función importante de los marcadores de cohesión es proporcionar correferencia, es decir, 
indicar al lector que las oraciones sucesivas del texto incluyen algún concepto mencionado 
previamente. Así, en un párrafo de una novela puede aparecer explícita o anafóricamente a lo 
largo de varias oraciones la mención del protagonista, de un objeto determinado, etc. Los 
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marcadores de cohesión y la correferencia son importantes, pero, finalmente, es el lector quien 
debe construir la coherencia utilizando las pistas proporcionadas por el texto y su propio 
conocimiento del mundo. Tom Givón (1992) asegura que la coherencia no está en el texto sino 
en la mente, es decir, que es el fruto de operaciones cognitivas. La mejor prueba de ello es que, 
a partir del mismo texto, un lector puede construir una representación coherente, bien 
integrada y completa, y otro lector, no. 

Suele distinguirse entre coherencia local y coherencia global. La coherencia local la establece 
el lector entre contenidos próximos en el texto, por ejemplo, entre cláusulas consecutivas, y 
está frecuentemente guiada por la presencia de marcadores de cohesión como anáforas y 
conecto res. La coherencia local es también favorecida por el hecho de que los contenidos 
vinculados están coactivados en la memoria de trabajo. Sin embargo, cuando leemos un texto 
extenso debemos ser capaces de establecer vínculos temáticos entre contenidos muy 
separados, es decir, debemos construir la coherencia global (Recuadro 9-2). 


Recuadro 9-2. Coherencia local e incoherencia global 


En un estudio, Albrecht y O'Brien (1993) comprobaron que los lectores de narraciones eran 
capaces de establecer la coherencia global de los textos. Para ello construyeron textos localmen- 
te coherentes, pero que podían ser globalmente coherentes o incoherentes. Veamos un ejemplo: 


Hoy, María se fue a comer con una amiga. Llegó temprano al restaurante y decidió sentarse a la mesa. 
Luego empezó a hojear el menú. 


A María le encantaba ese restaurante por su fantástica comida rápida. A ella le gustaba comer cualquier 
cosa, con tal de que fuese fácil de servir y rápida. De hecho, comía en el McDonald's al menos tres veces por 
semana. María nunca se preocupó de la dieta y no veía razones para cambiar sus hábitos alimentarios. [1] 


A María le encantaba ese restaurante por su fantástica comida saludable. Siempre atenta a la salud, 
María era una vegetariana estricta desde hacia años. Su comida favorita era la coliflor. Era tan rigurosa con 
la dieta que rehusaba comer cualquier cosa frita o con grasa. [2] 


A María le encantaba ese restaurante por su ambiente agradable y tranquilo. Solía acudir con frecuencia 
y se lo recomendaba a todos sus amigos. Lo que más le gustaba eran las mesas con sus manteles de estilo 
pueblerino. Todo esto la hacía sentirse como en casa. [3] 


Al cabo de 10 minutos, llegó la amiga de María. Hacía varios meses que no se veían. Por eso tenían mu- 
chas cosas de que hablar y estuvieron charlando durante media hora. Finalmente, María llamó al camarero 
para que tomase nota de lo que querían. María volvió a mirar el menú. Le costó mucho elegir su plato. María 
pidió una hamburguesa con queso y patatas fritas. Luego devolvió el menú al camarero. Su amiga no tuvo 
ninguna dificultad en decidir lo que quería. Pidió su plato y volvieron a charlar de nuevo. 


Todos los lectores leyeron el mismo comien- 
zo y el mismo final de la historia, pero algunos 
de ellos recibieron el párrafo [1], que describía 
a María como adicta a la comida rápida (glo- 
balmente coherente); otros, el párrafo [2], que 
la describía como vegetariana (globalmente 
incoherente), y otros, el párrafo neutral [3]. Se 
registraron, entre otros datos, los tiempos de 
lectura de la oración «María pidió una hambur- 
guesa con queso y patatas fritas», que se mues- 
tran en la figura 9-1, 


Coherente Incoherente Neutral 
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Figura 9-1. Tiempos de lectura de la oración crí- 


He La oración es localmente coherente en todos 


los casos, ya que está insertada en el mismo 
párrafo, pero es globalmente incoherente para los lectores que recibieron previamente el pá- 
rrafo [2]. Los tiempos de lectura de la oración crítica en el contexto [2] indican que los lectores 
detectaron la incoherencia global y dedicaron un esfuerzo especial para tratar de construir una 
interpretación coherente. 
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e Inferencias 
Un texto es siempre una guía incompleta hacia el significado. Como asegura Umberto Eco: 
«Todo texto es una máquina perezosa que le pide al lector que haga parte de su trabajo. Pobre 
del texto si dijera todo lo que el destinatario debe entender: no acabaría nunca» (Seis paseos 
por los bosques narrativos, 1994, p. 11). Ese trabajo que el texto «le pide» al lector son las 
inferencias con las que éste debe completar la información siempre limitada y críptica del 
texto. Hay que destacar que el término «inferencia» es un tanto vago en psicolingúística. 
Desde luego, no se trata de las inferencias deductivas que estudia la lógica, derivadas 
necesariamente de las relaciones formales entre ciertas premisas. Más bien se trata de 
recuperar contenidos de la memoria, basados en nuestros conocimientos semánticos y 
pragmáticos del mundo. 
Veamos el siguiente micro texto: 
Alicia sonríe a su marido mientras prepara el equipaje, sin olvidarse de guardar los 
trajes de baño y la crema de protección solar. Luego le dice a la niña que prepare su 
mochila, mientras el padre prepara unos bocadillos para todos. Cuando llega el taxi la 
niña lleva al gato a casa de su vecina y se despide cariñosamente de él, luego le da las 
gracias a la vecina. 
El lector podría, en principio, inferir muchos detalles entre líneas: 
- La familia se va de viaje de vacaciones (inferencia temática). 
- Alicia está casada (relacional). 
- Alicia se siente contenta (emocional). 
- Su destino es un lugar junto al mar (meta). 
- El lugar tiene un clima soleado (antecedente causal). 
- Tienen pensado ir a nadar (intención, meta). 
- Alicia tiene una hija (relacional). 
- El padre corta pan con un cuchillo (acción subordinada, instrumento). 
- El padre rellena el pan con embutidos, o queso (acción subordinada). 
- El padre envuelve los bocadillos (acción subordinada) . 
- La niña tiene un gato (pertenencia). 
- La niña acaricia al gato y le habla (acción, emoción). 
- La vecina se quedará con el gato (consecuente causal). 
- Han llamado a un taxi (antecedente causal). 
- La familia se sube al taxi (consecuente causal). 
- Eltaxi los llevará hasta el aeropuerto o estación (consecuente causal). 
- Etcétera. 
En las últimas décadas se han desarrollado gran número de investigaciones sobre las 
inferencias que realizan los lectores, tratando de responder a algunas preguntas clave. 
¿Cuántas inferencias? Si interrumpimos a un lector varias veces durante la lectura de una 
narración y le preguntamos qué va a pasar a continuación, cómo o por qué motivo, nos 
ofrecerá una amplia variedad de inferencias, parecidas a las sugeridas en el ejemplo anterior. 
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Si le pedimos que lea y comente en voz alta todo lo que le venga a la cabeza, mostrará 
igualmente unas sorprendentes capacidades inferenciales. 

Pero estos datos son engañosos, pues responder a preguntas o pensar en voz alta son tareas en 
las que el lector dispone de mucho tiempo para generar inferencias. Por el contrario, la lectura 
habitual es un proceso continuo que se desarrolla a gran velocidad (unas 250-400 palabras por 
minuto) y el lector no tiene tiempo ni recursos suficientes para generar todas las inferencias 
potenciales. 

Estas limitaciones temporales y cognitivas llevaron a Mckoon y Ratcliff (1992) a plantear una 
hipótesis minimalista sobre las inferencias. Según ellos, los lectores realizan muy pocas 
inferencias de forma automática y sólo si se cumplen algunas condiciones muy estrictas. Por 
ejemplo, sólo se producen inferencias entre cláusulas u oraciones consecutivas, que están 
coactivadas en la memoria de trabajo y cuando esas inferencias son necesarias para establecer 
la coherencia local. Las inferencias globales, que combinan contenidos distantes en el texto, 
quedan descartadas. La hipótesis minimalista tuvo en su momento un gran impacto, porque 
estaba planteada con mucha claridad, pero también porque muchos investigadores estaban en 
desacuerdo con ella y trataron de rebatirla. Parece improbable que la gente no realice al menos 
algunas inferencias globales; éstas parecen necesarias para comprender el argumento de una 
narración compleja. Por ejemplo, supongamos que en el capítulo 2 de una novela, el abuelo de 
María, a quién ella estaba muy unida, se muere. Si al comienzo del capítulo 7 se dice que 
María deja un ramo de flores ante una tumba podemos inferir inmediatamente que se trata de la 
tumba de su abuelo, a pesar de la gran distancia en el texto entre ambos sucesos. Sin embargo, 
la hipótesis minimalista fue muy fructífera al estimular nuevas investigaciones. Además 
postuló una idea importante: el lector no realiza todas las inferencias posibles en línea, pues 
ello desbordaría sus capacidades. 

La hipótesis construccionista de Graesser, Singer y Trabasso (1994) ofrece una visión más 
optimista de las inferencias. La teoría, basada en multitud de investigaciones, propone que los 
lectores de narraciones construyen en línea y de forma automática inferencias explicativas 
para interpretar los sucesos y acciones. Así, infieren las motivaciones de los personajes, sus 
metas e intenciones, sus emociones y las causas o consecuencias de los obstáculos tanto físicos 
como sociales. Las inferencias de los lectores no son muy diferentes de las que realizamos 
mientras vemos una película u observamos situaciones de la vida real (Graesser, 
Wiemer-Hastings y Wiemer-Hastings, 2001). Aunque el cine y las escenas reales ofrecen una 
rica información sensoriomotora sobre personas, objetos y lugares que está generalmente 
ausente en las narraciones, en todos los casos hay una información «invisible» que nosotros 
debemos añadir para dar pleno sentido a lo que vemos o leemos. Curiosamente, Graesser y sus 
colaboradores consideran que los lectores no infieren, al menos de forma sistemática o 
automática, los detalles visuales del entorno espacial, de los objetos o de los personajes, ni los 
procedimientos específicos de las acciones. Por ejemplo, en el texto sobre Alicia mencionado 
antes, el lector no infiere detalles específicos sobre el aspecto de las maletas, su posición 
espacial, el color de los trajes de baño, etc. Podemos, en algunas circunstancias representar 
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mentalmente con mucho detalle un entorno visual a partir de una descripción e inferir 
relaciones espaciales no explícitas en el texto, pero ello requiere un costoso proceso de 
aprendizaje que va más allá de la lectura en línea. 

¿Qué tipos de inferencias existen y cuándo se producen? Suele distinguirse entre 
inferencias puente e inferencias elaborativas. Las inferencias puente son necesarias para 
establecer la coherencia local entre dos cláusulas consecutivas; por ejemplo, cuando leemos: 
«El sol empezó a calentar. El muñeco de nieve empezó a derretirse», es muy probable que 
establezcamos un puente causal «el calor del sol derritió el muñeco», pues en caso contrario no 
habría modo de integrar ambas frases de modo coherente. Las inferencias elaborativas, por su 
parte, no son necesarias para establecer la coherencia local, sino que serían una actividad en 
cierto modo superflua del lector. En el ejemplo: «Pedro está comiendo sopa en el vagón 
restaurante del tren; de pronto, cuando acercaba cuidadosamente la cuchara a la boca, el 
tren frenó bruscamente». En este caso, el lector se encuentra con un texto coherente en sí 
mismo; sin embargo es probable que construya la inferencia elaborativa «la sopa se derramó». 
En relación con el curso temporal de las inferencias, también existen diversas propuestas. De 
modo general, suele hablarse de inferencias proactivas, que son las que ocurren de forma 
anticipada en el curso de la lectura, e inferencias retroactivas, que ocurren hacia atrás, con el 
fin de establecer la coherencia local entre las partes del texto que acabamos de leer. A grandes 
rasgos, las inferencias proactivas suelen ser de carácter elaborativo, mientras que las 
inferencias retroactivas son habitualmente inferencias puente. Las inferencias pueden estar 
moduladas por las características del lector y del texto, como se aprecia en el recuadro 9-3. 


Recuadro 9-3. Inferencias y ansiedad 


Las investigaciones sobre inferencias en el discurso generalmente describen el promedio de los 
resultados de grupos de participantes, asumiendo que todos ellos son más o menos equivalentes. 
Pero las inferencias pueden variar considerablemente en función de los rasgos individuales de 
los participantes y de los contenidos específicos del texto. Calvo y Castillo (2001) seleccionaron 
dos grupos de participantes que se diferenciaban en un rasgo de ansiedad, medido a través de 
un cuestionario estándar. Todos ellos leyeron mentalmente varios tipos de textos, presentados 
palabra a palabra de forma automática. Algunos textos presentaban un contexto amenazante 
[a], y otros eran textos de control que compartían muchas palabras con los anteriores pero no 
eran amenazantes [b]. Al finalizar cada texto recibían una palabra, relacionada con una posible 
consecuencia dramática (estrelló), que debían pronunciar inmediatamente en voz alta, y una 
llave vocal conectada al ordenador registraba la latencia de respuesta. 


Sin apenas visibilidad el avión se aproximó rápidamente a la peligrosa montaña y, al mismo tiempo, los 


pasajeros empezaron a gritar presas de pánico. [a] 
estrelló 

Cuando el avión despegó, los niños gritaron presas de pánico impidiendo al pasajero escuchar los co- 

mentarios de su amigo sobre el pico más peligroso de la montaña. [b] 
estrelló 


En los individuos de baja ansiedad el tiempo de nombrado de la palabra de prueba no se di- 
ferenciaba en los contextos amenazante y de control, lo cual indica que no realizaron inferencia 
alguna. En cambio los individuos ansiosos respondieron más rápido en el contexto amenazante, 
demostrando que habían hecho una inferencia y, por lo tanto, un rasgo de su personalidad afec- 
taba a los mecanismos de comprensión del lenguaje. 
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e Niveles de representación 
Durante la comprensión del discurso el lector genera al menos tres niveles de representación. 
La forma superficial, que es una representación exacta de las palabras, sintagmas y estructuras 
sintácticas del texto; el texto base, que retiene los conceptos y las relaciones semánticas, con 
independencia de las palabras, y, finalmente, el modelo de situación, que representa la 
situación descrita y es totalmente independiente de la estructura del texto. En la figura 9-2 se 
ilustran los tres niveles de representación para una oración. 


Forma superficial Texto base 
0 
N sv | 
v SN 


Jaime] [hojeó) | el) ( periódico ) 


Modelo de situación 


Cartelera 


Figura 9-2. Ilustración de los niveles de representación para la oración «Jaime hojeó el periódico». 


Una forma de disociar estos niveles de representación es observando su persistencia en la 
memoria. En un experimento clásico, Kintsch, Welsch, Schmalhofer y Zimni (1990) 
presentaron a los participantes textos como el siguiente: 
Era la tarde del sábado y Jaime y Melisa se aburrían, de modo que decidieron ir al cine. 
Jaime hojeó el periódico. Vio que tenían el tiempo justo para ir a la función de las 
nueve donde habían estrenado una comedia romántica. Y se fueron. 
Tras leer textos como el anterior, los participantes realizaron una prueba de memoria de 
reconocimiento, recibiendo una de las siguientes oraciones con instrucciones de juzgar si 
había aparecido en la historia o no: 
Jaime hojeó el periódico 
(oración idéntica) [a] 
Jaime echó un vistazo al periódico 
(paráfrasis: mismo significado) [b] 
Jaime miró la cartelera de cine 
(inferencia) [c] 
Jaime leyó los editoriales 
(control) [d] 


booksmedicos.org 


10 


Psicología del Lenguaje — TEMA 9 


Algunos participantes recibieron la prueba de memoria inmediatamente después de leer los 
textos, mientras que otros la recibieron 40 minutos, 2 días o 4 días más tarde. La respuesta 
correcta es «sí» en [a] y «no» en los demás casos. Sin embargo, las falsas alarmas (respuesta 
«sí» donde debería ser «no») también proporcionan una información muy útil sobre los niveles 
de representación. La repuesta «sí» en [a] tiene relación con la representación superficial del 
texto, en la paráfrasis [b] se relaciona con el texto base, y en la inferencia [c] se relaciona con 
el modelo de situación. Calculando índices de discriminabilidad a partir de las respuestas «sí» 
en los tres tipos de oraciones, en contraste con las oraciones de control, los autores estimaron 
la fuerza del trazo de memoria correspondiente a los tres tipos de representación. 

Como se aprecia en la figura 9-3, la forma superficial 


As sal tiene una persistencia de apenas unos minutos, el texto 


. : . -h Modelo 
D. AS ¿o? de situación 


var um Texworee | Dase se va debilitando a lo largo de las sesiones, y el 

poi a e pote | modelo de situación se mantiene estable incluso al cabo 
Se et > ¡de 4 días. 

e Este experimento indica que el modelo de situación 

O min 40 min 2 días. 4 dí3s retiene la información esencial de la narración a lo largo 

Aplazamiento | del tiempo, mientras que los otros niveles de 

Figura 9-3. Cálculo de la persistencia temporal, basa- Tepresentación son mucho más transitorios. Esto 


da en índices de discriminabilidad, de la forma superfi- incid la A d d 
cial del texto, del texto base y del modelo de situación. comcide con la intuicion: Cuando recordamos una 


Tomado de Kintsch et al. (1990). 


narración tendemos a olvidar las oraciones concretas y 
hasta la organización conceptual del texto, pero recordamos las situaciones a las que se refiere 
la narración (personajes, conflictos, acciones, etc.). Pero ¿qué son los modelos de situación? 
Son representaciones que guardan más parecido con una experiencia que con las 
características gramaticales o estructurales del propio texto. Precisamente, como veremos más 
adelante, los principales experimentos sobre modelos de situación intentan demostrar que la 
representación del referente que construye el lector puede disociarse de la representación del 
propio texto. A continuación se analizan algunas características de los modelos de situación. 

Representaciones de lo singular. Los modelos de situación son representaciones de patrones 
de información singulares o únicos, a diferencia de los esquemas o guiones (scripts), que son 
conocimientos semánticos, de carácter genérico. Veamos la diferencia entre modelos de 
situación y esquemas con un ejemplo. Supongamos que un amigo al que conocemos muy bien 
nos dice: «Ayer fui con mis padres al restaurante Tokio, que tú me recomendaste, y nos 
encontramos con mi antigua novia». Esta es una descripción de un episodio concreto, con una 
ubicación espacio-temporal determinada, que implica a personas específicas y con 
determinados vínculos entre sí, con estados motivacionales, de meta, etc. El modelo de 
situación que construimos de ese episodio es muy diferente de nuestras representaciones 
esquemáticas de los «restaurantes», de las «relaciones familiares» o de «las relaciones de 
pareja» en abstracto. Un esquema, por ejemplo el del «restaurante», es una especie de 
promedio estadístico o prototipo que resulta de procesar multitud de situaciones análogas, pero 
no representa ninguna situación particular. Como tal esquema, incluye información genérica 


booksmedicos.org 


11 


Psicología del Lenguaje — TEMA 9 


sobre los objetos prototípicos del restaurante (mesas, sillas, barra, menú, etc.), los roles 
(camarero, cliente, cocinero, etc.) o las acciones características (pedir el menú, elegir plato, 
etc.). En cambio, el modelo de situación que se construye al entender un fragmento de discurso 
como el anterior, es una representación de un estado particular de sucesos, que incluye 
combinaciones únicas de parámetros del tipo «quién dijo qué (a quién)», «quién sabe qué», 
«dónde está qué o quién», etcétera. 

Representaciones dinámicas. Todas las representaciones semánticas son en alguna medida 
dinámicas. Así, el concepto «médico» no es igual para una persona cuando tiene 10 años que 
cuando tiene 20 años y estudia medicina, y el esquema del «restaurante» se altera también a lo 
largo de nuestra vida, a medida que disponemos de más experiencias con restaurantes 
particulares. Sin embargo, los procesos de cambio conceptual o de cambio de esquemas son 
lentos, pues se distribuyen a lo largo de días, meses o años. En cambio, los modelos de 
situación se actualizan o «ponen al día» en fracciones de segundo, al tiempo que se procesa la 
propia situación cambiante o, en el caso del discurso, mientras se leen nuevas oraciones que 
describen cambios significativos en la situación. El proceso de actualización que realizamos, 
aparentemente con facilidad, es, sin embargo, complejo y requiere un sofisticado uso de 
nuestro conocimiento del mundo. Por ejemplo, debemos entender que cuando el general 
guarda un documento en la caja fuerte, el espía no lo va a encontrar encima de su mesa; que 
después de alcanzar la meta de detener al asesino confeso el detective no seguirá buscándolo; 
que cuando el protagonista ha quemado el periódico en la chimenea, luego no podrá leer las 
noticias deportivas en él; que al encontrarse cara a cara con un tigre la heroína sentirá miedo. 
Isomorfismo. Como se ha indicado, los modelos de situación se parecen a nuestra 
experiencia, es decir, mantienen cierto isomorfismo con las propias situaciones representadas 
y se diferencian, en cambio, de la estructura del texto superficial (lineal, sintáctica) o del texto 
base. La representación de una descripción espacial, por ejemplo, incluiría la ubicación y los 
desplazamientos de los objetos y personajes que se mencionan, y la accesibilidad de los 
conceptos dependería de suposición dentro de la situación y no de lo reciente de su mención en 
el texto superficial o en el texto base. Algunos autores consideran que los modelos de situación 
son representaciones corpóreas, de modo que retienen aspectos propios de nuestra interacción 
sensoriomotora con las situaciones (Glenberg y Kaschak, 2002; Zwaan, 2004). En su versión 
más extrema, los planteamientos corpóreos proponen también un isomorfismo neurológico. Es 
decir, durante la comprensión de narraciones se activarían parcialmente regiones corticales, 
responsables de la percepción visual o auditiva, de la ejecución de acciones o de los procesos 
emocionales. No obstante, existen posiciones, como la teoría de Van Dijk y Kintsch (1983), 
que aun defendiendo la existencia de modelos de situación, no consideran que éstos sean 
corpóreos sino que utilizarían el mismo formato proposicional que el texto base. 
Dimensiones básicas. El número de situaciones posibles y de sus cambios dinámicos es 
infinito. Consecuentemente, el número de modelos de situación y sus estados también debe ser 
infinito. Sin embargo, la composición interna de los modelos se reduce a la combinación de 
unas cuantas dimensiones básicas, que constituyen lo que podríamos denominar sus 
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«ladrillos» epistemológicos. Las dimensiones kantianas del tiempo, el espacio y la causación 
están implícitas en prácticamente todos los modelos de situación. Las situaciones se 
representan organizadas en un marco espaciotemporal, y los sucesos y acciones suelen 
vincularse en términos de causa-efecto. A ello habría que añadir los protagonistas como 
elementos vertebradores de la información situacional, lo cual implica, a su vez, un conjunto 
de parámetros interpersonales asociados, algunos de modo relativamente permanente (p. ej., 
estatus, sexo, vínculos interpersonales, relaciones de propiedad), y otros más transitorios (p. 
ej., metas, intenciones, estados emocionales). 
e Formato de la representación 

Hay bastante consenso sobre la existencia de los tres niveles de representación del discurso 
que se han mencionado. Sin embargo, los investigadores están divididos en cuanto al formato 
en que se representa el significado. Mientras que unos apuestan por representaciones 
simbólicas como el formato universal del significado, otros consideran que las 
representaciones, especialmente en el nivel de modelos de situación, son corpóreas o 
sensoriomotoras. Veamos brevemente ambos planteamientos. 
Proposiciones. Una idea dominante entre los simbolistas es que toda la información del 
discurso se representa en forma de proposiciones. La noción de proposiciones, procedente 
originalmente de la lógica, dista mucho de ser unitaria entre los investigadores. 'Tal como las 
entiende Kintsch (1998), las proposiciones son simplemente esquemas predicado-argumento 
que subyacen al texto superficial, con el formato general: predicado [argumento 1, argumento 
2... argumento N], Cada vez que comprendemos una oración, lo que haríamos sería traducirla 
al lenguaje mental de las proposiciones. Así, la oración: «María le dio un libro a Pedro» podría 
ser codificada como «dar» [agente: María; receptor: Pedro; objeto: libro], o más simple: «dar» 
[María, Pedro, libro]. A menudo una oración incluye más de una proposición. Las 
proposiciones de un texto son correferentes, es decir, comparten argumentos; además, suelen 
tener una relación jerárquica entre sí, de modo que un argumento de una proposición puede ser 
a su vez una proposición (P). Por ejemplo: 

«Ayer María le prestó a Pedro el libro que Laura le había regalado, pero él lo perdió.» 

Pl. Prestar [María, Pedro, libro]. 

P2. Ayer [P1] 

P3. Regalar [Laura, María, libro]. 

P4. Perder [Pedro, libro]. 

P5. Pero [P1, P4] 
Como puede observarse, la sintaxis, las anáforas y otras características del texto superficial 
están ausentes en las proposiciones P1-P5, que se limitan a reflejar las relaciones 
predicado-argumento. De hecho, las proposiciones son compatibles con textos 
superficialmente diferentes. Por ejemplo, el conjunto de proposiciones P1-P5 serían válidas 
para las siguientes paráfrasis: 

- Laura le regaló un libro a María, quien a su vez se lo prestó ayer a Pedro, aunque éste 
lo perdió. 
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PSICOLOGÍA DEL LENGUAJE 
- El libro que le fue regalado por Laura a María, ella se lo prestó a Pedro ayer. Sin 
embargo, él lo perdió. 
- Pedro perdió el libro, a pesar de que se lo había prestado María el día anterior. El libro 
era un regalo de Laura a María. 
- Etcétera. 
La adecuación de las proposiciones a diferentes paráfrasis es una propiedad psicológicamente 
relevante. Indica que las proposiciones no se limitan a reproducir el texto mismo, sino que 
abstraen las relaciones conceptuales subyacentes. En otras palabras, reflejan las características 
del texto base y no las del texto superficial. Respecto al modelo de situación, la validez de las 
representaciones proposicionales está menos clara. Como se ha señalado antes, los modelos de 
situación son análogos a la experiencia, diferenciándose del texto superficial pero también del 
texto base. A pesar de ello, el propio Kintsch, uno de los primeros en postular la importancia 
de los modelos de situación en el discurso, considera que éstos también se codifican en forma 
de proposiciones. 
Aunque los argumentos de una proposición son generalmente conceptos genéricos, las pro- 
posiciones pueden reflejar también ejemplares concretos de un concepto, utilizando un artifi- 
cio notacional: 
«María le prestó un libro a Pedro, y él le regaló a ella otro.» 
Pl. Prestar [María, Pedro, X]. 
P2. Regalar [Pedro, María, Y]. 
P3. Es un [X, libro]. 
P4. Es un [Y , libro]. 
En la oración anterior se mencionan dos libros distintos, representados en P1 y P2 con los 
argumentos X e Y, respectivamente. Las proposiciones P3 y P4 redefinen dichos argumentos 
como ejemplares de la categoría «libro», mediante el predicado «es un». 
El carácter formal de las proposiciones las hace especialmente aptas, como veremos, para 
desarrollar modelos computacionales de los procesos del lenguaje. Sin embargo, no está claro 
en qué medida las proposiciones tienen «realidad psicológica». ¿Son una mera convención 
formal del científico para representar la información? o bien ¿son el modo en que el cerebro 
realmente codifica la información? Los estudios empíricos sobre esta cuestión son escasos, 
aunque hay cierta evidencia favorable a la funcionalidad de las proposiciones elaboradas 
durante la comprensión del lenguaje. Por ejemplo, cuanto mayor es el número de 
proposiciones implícitas en las oraciones, mayor es el tiempo de lectura, con independencia 
del número de palabras (véase la revisión de Kintsch, 1998). 
Quizás el estudio más notable sobre la realidad psicológica de las proposiciones fue 
desarrollado por Ratcliff y McKoon (1978), mediante una tarea de memoria. Los 
participantes estudiaban listas de oraciones como: «El mausoleo que consagró el zar domina la 
plaza». Esta oración incluye dos proposiciones: «dominar [mausoleo, plaza]» y «consagrar 
[mausoleo, zar]». Posteriormente, los individuos recibían pares de palabras pertenecientes a 
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las oraciones, observándose una mayor facilitación semántica o priming entre palabras 
pertenecientes a la misma proposición (domina-mausoleo), que a diferentes proposiciones 
(domina-zar). En otros experimentos posteriores se comprobó, asimismo, que los sujetos que 
recibían «domina» como índice de recuerdo, recordaban más frecuentemente «plaza» que 
«zar». Estos resultados son interesantes, al demostrar que la estructura del significado no es 
igual que la estructura del texto, pero no indican nada sobre la naturaleza de las unidades de 
significado que podrían ser proposiciones, pero también escenas visuales o simulaciones 
mentales. Por ejemplo, el lector podría generar una escena visual del mausoleo dominando la 
plaza, y otra escena, quizás en un marco temporal distinto, en que el zar consagra el mausoleo 
(Zwaan, 2004). 

Simulaciones corpóreas. Por su parte, las teorías corpóreas del significado se ajustan muy 
bien a las características de los modelos de situación. Proponen que el lenguaje está anclado en 
el mundo. Es decir, que los mismos mecanismos perceptivos, motores y emocionales del 
cerebro empleados en la construcción de la experiencia real participan, en cierto grado, en el 
procesamiento del significado lingúístico. Según el enfoque corpóreo, el significado consiste 
en la simulación mental (o neuronal) de los objetos, eventos y situaciones a los que se refieren 
las palabras. Por ejemplo, si leemos «Juan rasgueó las cuerdas de la guitarra», se activarían 
fugazmente en nuestra mente simulaciones visuales, auditivas, motoras y hasta emocionales 
de la escena. Más aun, si se registrase nuestra actividad cerebral, podríamos esperar 
«resonancias» neuronales en las cortezas visual, auditiva y motora que se solaparían con las 
que están involucradas en la observación de alguien tocando la guitarra e, incluso, en la acción 
real de tocar la guitarra. Las teorías corpóreas del significado no están formalmente tan bien 
articuladas como las que se basan en proposiciones. Sin embargo, como se ha mencionado en 
el capítulo 8, tienen un considerable apoyo empírico, basado en experimentos tanto 
conductuales como neurológicos. Además, el planteamiento corpóreo está biológicamente 
bien motivado. Como ocurre en muchas otras especies animales, el cerebro humano incluye 
extensas redes neurales para procesar en línea información biológicamente relevante: 
percibiendo e integrando estímulos en varias modalidades, planificando y ejecutando acciones 
motoras o procesando el valor emocional o afectivo de los estímulos. Parece razonable que el 
lenguaje humano, una función cerebral relativamente nueva, reutilice las redes 
sensoriomotoras del cerebro para nuevas funciones como representar el significado. Esto 
tendría ventajas funcionales, ya que gran parte de la comunicación humana se refiere a objetos, 
acciones y eventos sensoriomotores, de modo que el significado corpóreo permitiría establecer 
la referencia lingúística de forma más eficaz que el uso de proposiciones abstractas y 
amodales. 

¿Cuál de estas propuestas -proposicional o corpórea- es más válida? Existen aproximaciones 
híbridas que postulan que las representaciones del significado utilizan formatos múltiples, 
tanto simbólicos como corpóreos. Sin embargo, no está tan claro que el enfoque proposicional 
y el enfoque corpóreo sean reconciliables, puesto que parten de supuestos que entran 
directamente en conflicto. Por ejemplo, los proposicionalistas asumen que los predicados y 
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argumentos de las proposiciones son símbolos abstractos, amodales y arbitrarios. Así, el 
símbolo «libro» es una abstracción de todas las experiencias de libro, pero no es ningún libro 
concreto; es amodal, es decir que el símbolo conceptual «libro» no tiene ninguna característica 
sensoriomotora específica; por lo tanto, será el mismo símbolo cuando leemos la palabra libro, 
la oímos, vemos un libro o pensamos en un libro. Finalmente, el carácter arbitrario del símbolo 
«libro» indica que no se parece a los objetos que llamamos «libro», pero tampoco a la palabra 
«libro». En realidad, deberíamos utilizar un símbolo arbitrario como N para referirnos al 
concepto, y la notación proposicional debería tener un aspecto algebraico como Z [A, J, Y], en 
lugar del aspecto más «amistoso» que hemos visto antes: dar [María, Pedro, libro]. 

El planteamiento corpóreo propone algo muy diferente: las representaciones son simulaciones 
sensoriomotoras, análogas a la experiencia, es decir, representaciones concretas, modales y 
analógicas. De vez en cuando los investigadores proposicionalistas (simbolistas) y los 
corpóreos debaten sus posiciones intentando llegar a un acuerdo o, al menos, a definir mejor 
sus desacuerdos. Por ejemplo, en 2005 se desarrolló un debate en Tenerife, en el que 
participaron investigadores representativos del simbolismo (Walter Kintsch, Marcel Just, Max 
Louwerse, etc.), de la corporeidad (Lawrence Barsalou, Arthur Glenberg, Rolf Zwaan, 
Frie-demann Pulvermiiller, etc.), y con posiciones intermedias (Arthur Graesser, Tony 
Sanford, Manuel de Vega, etc.). El debate dio lugar a una publicación (de Vega, Glenberg y 
Graesser, 2008) que arroja alguna luz sobre las fortalezas y debilidades de ambos 1 6 
planteamientos y que se resumen en la tabla 9-2. 


Tabla 9-2. Fortalezas y debilidades de los planteamientos simbólicos y corpóreos 


Fortalezas Debilidades 

Proposiciones y simbolos Son computables, se pueden construir No se anclan en la experiencia 
modelos formales a partir de ellos sensoriomotora. En general, 

Reflejan propiedades relevantes los simbolos se refieren a otros 
del significado: la distinción predicado- simbolos (significado intensional), 
argumento, el carácter abstracto pero no se conectan con el mundo 
del texto base, la distinción entre (significado extensional) 
categoría y ejemplar (type-token), Su apoyo empírico es débil. No se ha 
la correferencia, etc. demostrado su realidad psicológica 
Son representaciones universales: pueden La fundamentación neurológica 
describir la organización de la memoria de los simbolos es también débil. 
semántica, la información de oraciones No hay un «módulo» semántico 
y de textos complejos, los modelos en el cerebro independiente 
de situación, los procesos de los procesos sensoriomotores 
de razonamiento, etc. (una excepción es la teoría del hub 
de Patterson et al. [2007], descrita 
en el cap. 7) 

Simulaciones corpóreas Están biológicamente motivadas: los No está claro que las activaciones 
mecanismos cerebrales sensoriomotores sensoriomotoras en el cerebro sean 
se reutilizarían para procesar funcionales. Podrían ser meros 
el significado, sin necesidad epifenómenos, independientes 
de un «módulo» semántico nuevo del verdadero significado 

Tienen un fuerte apoyo empírico, basado Los procesos corpóreos no se 
en experimentos conductuales han formalizado en una teoría 
y neurológicos computacional detallada. 
Existen modelos neurológicos bastante El planteamiento es demasiado 
detallados sobre la conectividad empinico 
funcional entre áreas lingúísticas El lenguaje es, en gran medida, 
y áreas sensoriomotoras que apoyan abstracto. El significado de palabras 
la corporeidad como «idea», «proceso» o «nunca» 
Permiten una conexión directa entre el no tienen nada de sensoriomotor 


significado lingúístico y el mundo real. 
El significado corpóreo prepara para la 
acción y ayuda a especificar la referencia 
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e Conclusiones 
Los fenómenos del discurso descritos en este apartado están estrechamente relacionados entre 
sí. La construcción de la coherencia del texto requiere realizar inferencias locales y globales, 
ya que el lector debe utilizar activamente su conocimiento del mundo para completar la 
información siempre reducida del texto. A su vez, la coherencia y las inferencias son posibles 
gracias a las representaciones del texto base y a los modelos de situación que construye el 
lector u oyente sobre los referentes del texto. 
Por otra parte, una dificultad que comparten muchos fenómenos del discurso es lo que 
podríamos denominar el problema computacional. La complejidad de las operaciones 
realizadas y la rapidez con que se ejecutan parecen llevar al límite -y aun excederlos— los 
recursos cognitivos de nuestra memoria de trabajo. Según las teorías tradicionales, la memoria 
de trabajo es un mecanismo inteligente, capaz de combinar fuentes de información diversas, 
realizar inferencias, aplicar estrategias, etc., y, por lo tanto, tiene un gran protagonismo en 
todas las formas complejas de pensamiento, incluida la comprensión en línea del discurso. 
Estas capacidades funcionales se ven contrarrestadas por el hecho de que la memoria de 
trabajo sólo puede operar con un número pequeño de unidades de información (p. ej., las 
últimas palabras o sintagmas que acabamos de leer) y sólo durante unos segundos. Sin 
embargo, algunos de los fenómenos del discurso mencionados, como la construcción de la 
coherencia global y la realización de inferencias globales, exceden aparentemente los recursos 
de la memoria de trabajo. ¿Cómo pueden combinarse fuentes de información no coactivadas 
en la memoria de trabajo? En la misma línea, ¿cómo es posible elaborar modelos de situación 
análogos a la experiencia sin producir una explosión computacional? La posición minimalista 
de McKoon y RatclifF (1992), mencionada antes, simplemente niega la existencia de procesos 
de coherencia y de inferencias globales y rechaza también la noción de modelo de situación. 
Sin duda, se trata de una solución extrema, que deja insatisfechos a muchos investigadores. 
La mayoría de las investigaciones y teorías descritas en este capítulo asumen que durante la 
comprensión del discurso se emplean los recursos cognitivos disponibles de modo muy 
eficiente. En primer lugar, la información del texto superficial se elimina rápidamente, 
liberándose recursos de memoria para construir el texto base y los modelos de situación. 
Cabría pensar que los modelos de situación, dados su carácter experiencial y su constante 
actualización, son representaciones sumamente ricas y detalladas, como una especie de 
películas mentales, produciendo a su vez una demanda excesiva de la memoria de trabajo. Lo 
cierto es que los modelos de situación son representaciones muy reducidas en comparación 
con la experiencia real. Por ejemplo, la información espacial en los modelos de situación es 
sumamente esquemática comparada con la información espacial en la experiencia perceptiva. 
Por otra parte, el número de inferencias realizadas en línea es relativamente escaso, incluso 
para las teorías construccionistas. Finalmente, durante la comprensión, los recursos 
atencionales recaen en cada instante sobre unas pocas entidades activadas en el foco del 
discurso, mientras que el resto de la información leída permanece en el fondo con activación 
reducida. 
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INVESTIGACIONES SOBRE MODELOS DE SITUACIÓN 
e Dimensión espacial 

La dimensión espacial fue la más investigada inicialmente en el ámbito de los modelos de 
situación. Una razón para ello es metodológica: es relativamente sencillo elaborar textos 
experimentales en los que la estructura superficial —y la correspondiente estructura 
proposicional que de ella se deriva— difieran totalmente de la estructura espacial de la 
situación a la que se refieren. Son textos en los que se favorecería la divergencia entre los 
«productos» de los distintos niveles de representación del discurso. De este modo es posible 
distinguir mejor su respectiva importancia en la comprensión. El estudio clásico de Glenberg, 
Meyer y Lindem (1987) ilustra perfectamente esta lógica experimental. Los participantes leían 
breves textos en los que un personaje realizaba una serie de acciones. Cada texto incluía una 
frase crítica que establecía una asociación espacial entre el personaje y un objeto («se puso la 
camiseta») o bien una disociación entre ellos («se quitó la camiseta»). Por ejemplo: 

John se entrenaba para una maratón. 

- Tras hacer unos ejercicios de calentamiento, se puso la camiseta y se fue a correr. [1] 

- Tras hacer unos ejercicios de calentamiento, se quitó la camiseta y se fue a correr. [1] 

Corrió alrededor del lago sin dificultad. [2] 

Más tarde empezó a tener dolor en los músculos. [3] 

Palabra de prueba: camiseta. 
En un momento determinado se presentaba una palabra de prueba (camiseta) referida al objeto 
asociado o disociado en la oración crítica. Los lectores debían simplemente identificarla como 
perteneciente o no al texto, y el ordenador registraba el tiempo de respuesta. La palabra de 
prueba se presentaba inmediatamente después de la oración crítica [1], después de una oración 
de relleno [2] o después de dos oraciones de relleno [3]. Los resultados se muestran en la figura 
9-4, 


Como puede apreciarse, cuando la palabra de prueba se 
1.400 


esco! presentó ¡inmediatamente (posición 1) no hubo 
1.300 el te e, : 
lloros olaaa diferencias significativas entre la versión asociada y la 
=> E e : . e 5 
gl], “ET ¿Ne disociada, ya que en ambos casos la forma superficial de 
2 10007 y Pinar? la oración está todavía activa en la memoria. Sin 


embargo, cuando se introdujeron una o dos oraciones de 


1 2 3 relleno, la forma superficial se desvanece y se observa 
Posición de la palabra a a , 
de prueba una Clara ventaja de la versión asociada sobre la 


Figura 9-4. Latencia de respuesta de reconocimiento disociada. ¿Cómo explicar este efecto? Obsérvese que 

ante la palabra de prueba («camiseta»), en la versión ] , . 

asociada y disociada. Tomado de Glenberg et al. (1987). entre la palabra «Camiseta» que aparecia al comienzo 
del texto y la palabra de prueba al final, las oraciones de relleno intercaladas fueron idénticas 
en ambas versiones de la tarea. Asimismo, la estructura proposicional o texto base fue idéntica 
en los dos casos: «poner [John, camiseta]» en la versión asociada y «quitar [John, camiseta)» 
en la disociada. Las diferencias de activación halladas entre ambas condiciones de tarea, por lo 


tanto, sólo pueden deberse a la estructura espacial de la situación. En la versión asociada el 
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objeto queda vinculado espacialmente al personaje, y mientras éste siga en el foco del 
discurso, el objeto será accesible. En la versión disociada el personaje está en el foco del 
discurso, pero el objeto ha quedado separado de éste y por consiguiente ya no resulta accesible. 
Ahora bien, el experimento de Glenberg et al. (1987) sólo demuestra que el lector se representa 
una relación espacial muy simple entre un personaje y un objeto. ¿Qué ocurrirá cuando una 
narración describe escenarios espaciales más complejos? La intuición nos sugiere que el lector 
no construye una representación espacial detallada en línea, porque ello consumiría excesivos 
recursos cognitivos y porque la información espacial es sólo una de las dimensiones de la 
narración y no siempre la más relevante. Por ejemplo, si leemos una novela de Agatha Christie 
en la que se describe detalladamente el interior de una casa con varias habitaciones, incluida la 
escena del crimen, con multitud de detalles sobre los objetos y su posición espacial, es posible 
que el lector no se moleste en representarse toda esta información o lo haga de una forma muy 
incompleta. Por supuesto, podría construir un modelo detallado, elaborando imágenes 
mentales de los escenarios, pero seguramente tendría que leer y releer el texto y desarrollar 
procesos de razonamiento. Pero esto ya no sería comprensión en línea. De hecho, los 
resultados de algunas investigaciones efectuadas por de Vega (1995) parecen indicar que, 
durante la lectura, sólo en ciertas condiciones ocurren esos procesos de generación y 
actualización de un modelo espacial más o menos detallado y preciso. La conclusión general 
es que los modelos de situación espacial se elaboran con poco detalle en línea, lo cual coincide 
con la teoría constructivista de las inferencias mencionadas con anterioridad (Graesser et al. 
1994). Hay investigaciones publicadas en las que se muestra que los participantes pueden 
elaborar representaciones detalladas de escenarios, a partir de descripciones de éstos, e incluso 
pueden inferir relaciones espaciales no explícitas en las descripciones. Pero no se considerarán 
aquí, puesto que no se trata de tareas de comprensión en línea, sino de tareas de aprendizaje a 
partir de textos. 
e Dimensión temporal 

El tiempo es una dimensión fundamental en el lenguaje. La propia estructura del lenguaje es 
temporal: los fonemas, las palabras y las oraciones se pronuncian y se comprenden 
secuencial-mente. Dado que los sucesos en los modelos de situación también suelen tener una 
estructura secuencial, una estrategia muy común del lector u oyente es aplicar el principio de 
iconicidad temporal. Es decir, generalmente se asume que el orden de las cláusulas y oraciones 
corresponde al orden cronológico de los eventos en el mundo narrativo. 
En el siguiente ejemplo [a] y [b] darían lugar a modelos de situación diferentes, ya que 
describen secuencias temporales distintas, a pesar de que no hay ninguna indicación explicita 
del orden: 

El vigilante abrió la puerta, miró alrededor y preguntó si había alguien. [a] 

El vigilante preguntó si había alguien, miró alrededor y abrió la puerta. [b] 
El principio de iconicidad fuerte asume, además, que los sucesos descritos ocurren de forma 
continua, sin ningún lapso de tiempo entre ellos. Por ejemplo, en [a], entre la acción de abrir la 
puerta y la de mirar alrededor, entendemos que sólo transcurre un breve instante. Además del 
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principio de iconicidad, que aplicamos por defecto, el lenguaje dispone de recursos léxicos y 
gramaticales para expresar diversos matices temporales. Por ejemplo, en castellano y en la 
mayoría de las lenguas no es posible pronunciar una oración sin utilizar un tiempo verbal que 
ubica los eventos en presente, pasado o futuro respecto al marco temporal del hablante. Esta 
información temporal obligatoria es algo tosca; por ejemplo, los mismos morfemas de tiempo 
pasado pueden emplearse para algo que ocurrió hace un minuto («Luis se sentó en la silla») o 
hace siglos («Napoleón se sentó en el trono»). No obstante, hay otros recursos lingúísticos, 
como los adverbios y las locuciones adverbiales, que indican al lector u oyente distintos 
matices temporales e, incluso, que no debe aplicar el principio de iconicidad. En este último 
caso, la comprensión tiene mayor coste cognitivo ya que el lector tiene que reordenar 
mentalmente los eventos prescindiendo de su orden de mención en el texto. Veamos algunos 
ejemplos: 

El vigilante abrió la puerta después de mirar alrededor (violación de iconicidad — la 

acción de la segunda oración ocurre en primer lugar). 

El vigilante abrió la puerta mientras miraba alrededor (violación de iconicidad — las 

acciones de la primera y la segunda oración ocurren simultáneamente). 

Juana escribió su novela un año antes de su boda (violación de iconicidad —= los 

eventos pasados no son consecutivos). 

Adela trabaja mucho, pero la próxima semana se irá de vacaciones (violación de 

iconicidad —> los eventos futuros no son consecutivos). 
Todas las propiedades estructurales, léxicas y morfológicas del lenguaje mencionadas deben 
guiar al lector u oyente en la construcción de modelos de situación organizados 
temporalmente. Pero, ¿es esto cierto? Uno de los primeros estudios experimentales que 
verificó la temporalidad de los modelos de situación fue desarrollado por Zwaan (1996). Se 
presentaba a los lectores microtextos que incluían una locución adverbial que indicaba 
continuidad (un momento después) o diferentes grados de distancia temporal (una hora 
después, un día después) entre los eventos. Por ejemplo: 

Jaime se volvió hacia su ordenador y empezó a teclear. 

Un momento después sonó el teléfono. 

Una hora después sonó el teléfono. 

Un día después sonó el teléfono. 

Era su amigo Jorge que le invitó a jugar al golf... 

Palabra de prueba: teclear. 
Se registraron los tiempos de lectura de la oración adverbial «...después sonó el teléfono» y 
también el tiempo de identificación de una palabra de prueba, que en los ítems experimentales 
pertenecía a la primera cláusula. Esta última medida indicaba la activación de la situación 
inicial. Los resultados se muestran en la figura 9-5. Tanto los tiempos de lectura como la 
medida de activación fueron más rápidos cuando el adverbio indicaba continuidad, ya que el 
lector aplica el principio de iconicidad integrando el nuevo evento en la situación. En cambio, 
los adverbios que indicaban discontinuidad temporal produjeron lecturas y respuestas más 
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lentas, lo cual sugiere que el lector deja de aplicar la iconicidad, introduciendo un cambio 
temporal. Curiosamente, no hubo diferencias entre la discontinuidad breve (una hora después), 
que no supone un cambio de escenario del personaje, y la discontinuidad larga (un día 
después), que implica un cambio de escenario. 


Tiempo de lectura Tiempo de reconocimiento 
de la oración temporal de la palabra de prueba 
Un día 


Uña hos Una hora Un día 


Tiempo (ms) 
Tiempo (ms) 


Adverbio temporal Adverbio temporal 


Figura 9-5. Efectos de la discontinuidad temporal (una hora más tarde, un día más tarde) en comparación con la 
continuidad temporal (un momento más tarde), en los tiempos de lectura de una oración y en el reconocimiento 
de una palabra. Tomado de Zwaan (1996). 


Según Zwaan, esto indica que lo importante es simplemente la ruptura de continuidad 
temporal en el modelo de situación. 
La morfología de los verbos no sólo indica una ubicación temporal gruesa, sino que puede 
también situarnos en una perspectiva temporal subjetiva, modulando el foco atencional sobre 
los eventos. Concretamente, el aspecto verbal permite expresar, desde la perspectiva del 
hablante, los eventos pasados como ya culminados (perfectivo) o en curso de realización 
(imperfectivo o progresivo): 

- Dalia ha jugado un partido de tenis en el hotel (aspecto perfectivo —> acción 

terminada). 

- Dalia estaba jugando un partido de tenis en el hotel (aspecto imperfectivo —> acción 

en curso). 
El aspecto verbal también tiene consecuencias sobre la construcción de modelos de situación y 
los procesos de activación en el lector u oyente. En un experimento, Carreiras, Carriedo, 
Alonso y Fernández (1997) utilizaron un paradigma de activación para valorar cómo el 
aspecto verbal puede modular la accesibilidad de los conceptos en la lectura. Presentaron a los 
individuos breves textos que describían un evento en forma perfectiva o imperfectiva: 

Juan trabaja de camarero en un restaurante. 

María come allí todos los días. 

Juan estaba terminando su turno de trabajo cuando María llegó al restaurante. [a] 

Juan ha terminado su turno de trabajo cuando María llegó al restaurante. [b] 

Ella pidió el plato del día. 

Luego leyó el periódico mientras esperaba la comida. 

Prueba: Juan 
Los resultados mostraron que el nombre del personaje inicial (Juan) era más accesible en la 
versión imperfectiva o progresiva [a] que en la perfectiva [b], y esto ocurrió cuando la palabra 
de prueba se presentaba inmediatamente y también cuando se presentaba después de 1 ó 2 
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frases de relleno. Esto indica que en la versión imperfectiva se entiende que Juan permanece 
asociado, al igual que María, a la situación, mientras que en la versión perfectiva Juan ha 
quedado disociado del modelo de situación y sólo permanece en el foco María. El efecto es 
análogo al que encontraron Glenberg et al. (1987), con la asociación y disociación espacial, 
pero en este caso el factor determinante es la perspectiva temporal, ligada al aspecto verbal. 
e Dimensión emocional e interpersonal 

Los seres humanos disponemos de mecanismos de empatía que nos permiten inferir y hasta 
compartir las emociones de los demás en nuestras relaciones interpersonales. A su vez, las 
narraciones pueden ser inductoras de emociones. Nos interesan las novelas, las películas o el 
teatro en gran medida porque producen en nosotros sentimientos y emociones vicarias, al 
identificarnos con la perspectiva de los protagonistas. Algunos estudios han tratado de 
verificar si, en efecto, los lectores son capaces de mantener la perspectiva emocional de los 
personajes de una narración. 
Como se ha señalado en el capítulo 8, las oraciones con contenido emocional están asociadas a 
simulaciones en las que intervienen incluso las expresiones faciales. Por su parte, el primer 
trabajo sobre la comprensión de emociones en el discurso fue desarrollado por Gernsbacher et 
al. (1992), quienes presentaron a los participantes pequeñas historias en las que el protagonista 
se encontraba en una situación inductora de una emoción, aun cuando ésta no se nombraba 
explícitamente. Por ejemplo: 

Joe trabajaba en una tienda para obtener dinero para sus gastos. Una noche, Tom, su 

mejor amigo, fue a comprar un refresco a la tienda. Joe tuvo que ir un momento al 

almacén. Mientras Joe estaba ausente, Tom se dio cuenta de que la caja registradora 

estaba abierta. Rápidamente cogió de su interior un billete de diez dólares. Al día 

siguiente, se enteró de que habían despedido a Joe porque había faltado dinero de la 

caja. 

Pasaron semanas antes de que Tom dejara de sentirse culpable (coherente: tiempo de 

lectura: 2.600 ms). [a] 

Pasaron semanas antes de que Tom dejara de sentirse orgulloso (incoherente: tiempo 

de lectura: 3.800 ms). [b] 
Tras recibir el contexto inductor de la emoción, algunos participantes leían la oración [a] con 
una emoción coherente con el contexto, y otros leían la oración [b] con una emoción 
incoherente. Los tiempos de lectura fueron más rápidos en la versión coherente que en la 
incoherente, indicando que en el transcurso de la lectura de narraciones, y como parte del 
modelo de situación que el lector construye, se activa inmediatamente una representación del 
estado emocional de los protagonistas. Dicha representación emocional es relativamente 
precisa, es decir, no refleja sólo rasgos generales de dicho estado, como la valencia de la 
emoción, sino que es suficientemente rica como para distinguir entre estados emocionales 
relativamente próximos (entre «culpable» y «envidioso»), según demostraron Gernsbacher et 
al. en otro experimento. Además, no parece guiada por la presencia de etiquetas emocionales, 
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sino que formaría parte de la comprensión de la cadena de acciones, metas y relaciones entre 
los personajes que constituyen una narración. 
Dado que las narraciones tratan de personajes ficticios o reales, el lector debe ser capaz de 
representarse rasgos más o menos estables de éstos como su estatus, sexo, edad o apariencia 
física. Así, Sanford, Moar y Garrod (1988) investigaron cómo los lectores asignan diferente 
importancia narrativa a los personajes, teniendo en cuenta ciertos elementos léxicos del texto. 
Concretamente, observaron que cuando una frase incluye un protagonista mencionado por su 
nombre propio (Juan, María, etc.) y un personaje secundario descrito por su rol (el camarero, el 
profesor, etc.), el lector elige la perspectiva del protagonista y le dedica una atención 
preferencial. Los participantes recibían breves párrafos como los siguientes: [a] «El cura 
esperaba junto a la iglesia. María se dirigió hacia él», o [b] «El padre Benítez esperaba junto a 
la iglesia. La mujer se dirigió hacia él». La tarea de los lectores era completar la historia con 
una frase. Invariablemente los que recibían [a] eligieron «María» en lugar de «el cura» como 
sujeto de la oración, mientras que los que recibían [b] eligieron el padre Benítez como sujeto. 
Anderson, Garrod y Sanford(1983) también demostraron que el protagonista (citado por su 
nombre propio) no está ligado a un escenario particular en la narración, es decir, cuando el 
texto describe un cambio de lugar, el protagonista continúa accesible en la memoria del lector. 
Por el contrario, los personajes secundarios son dependientes de escenario: el camarero está 
ligado al restaurante, el profesor a la universidad, el futbolista al estadio, etc. Por lo tanto, 
cuando en el texto se produce un cambio de escenario, la accesibilidad (activación) del 
personaje secundario disminuye, mientras que la del protagonista con nombre propio se 
mantiene. 
Los lectores también utilizan las relaciones de estatus entre los personajes para interpretar 
oraciones ambiguas. Holtgraves (1994) presentó a los participantes breves textos con dos 
personajes que realizaban una tarea en colaboración y mantenían una relación de alto estatus y 
de subordinado [la] o una relación de igualdad de estatus [Ib]. La última oración del texto 
consistía en una petición indirecta convencional de uno de los personajes al otro [2a], o bien un 
comentario negativo trivial, pero que en el contexto podía tener el carácter de una petición no 
convencional [2b]: 

Marta y Luisa trabajan en la biblioteca universitaria. 

Marta es la directora de la biblioteca y Luisa es su ayudante becaria. [1a] 

Las dos son ayudantes becadas de la biblioteca. [1b] 

Esta tarde tienen que catalogar algunos libros y piensan hacerlo en una sala de 

reuniones. La habitación no se usa habitualmente y la estufa está apagada. Por lo 

tanto, hace mucho frío. Poco después de empezar a trabajar Marta le dice a Luisa: 

¿Podrías encender la estufa? [2a] 

Parece que hace mucho frío aquí. [2b] 
Los tiempos de lectura de la última oración mostraron que la petición convencional [2a] se 
comprendía fácilmente tanto en el contexto de alto estatus como de igualdad de estatus. Sin 
embargo, la petición no convencional [2b] se entendió con facilidad en el contexto de alto 
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estatus, pero requirió un esfuerzo adicional en el contexto de igualdad de estatus. En otras 
palabras, las peticiones indirectas convencionales se comprenden inmediatamente cualquiera 
que sea el contexto interpersonal, pero los comentarios negativos como [2b] son muy 
ambiguos y el lector aplica su conocimiento pragmático de las relaciones de estatus para 
interpretarlos. Así, infiere con facilidad que [2b] es una petición pero sólo cuando quien lo 
pronuncia es un personaje de alto estatus. 
No sólo los lectores se representan el estatus de los personajes, sino también sus estados 
mentales, incluido su grado de conocimiento sobre los eventos. Es frecuente en las narraciones 
que el protagonista «desconozca» un suceso de importancia crítica, mientras que otros 
personajes y el propio lector tiene un conocimiento privilegiado de dicho suceso. Esta 
disociación de estados de conocimiento contribuye sin duda al dramatismo de la obra literaria. 
Por ejemplo, en Romeo y Julieta, el lector sabe que Julieta está dormida a causa de una droga 
que simula la muerte, pero Romeo desconoce este hecho y cree (erróneamente) que Julieta está 
realmente muerta. ¿Qué hace el lector ante este conflicto entre lo que él o ella sabe y lo que el 
protagonista sabe? Quizás el lector sea egocéntrico y atribuya su conocimiento (privilegiado) 
también al protagonista, o bien, el lector podría ponerse en la «perspectiva mental» de Romeo 
y comprender así sus sentimientos y las acciones derivadas de su ignorancia. De Vega, Díaz y 
León (1997) estudiaron la capacidad de perspectivismo mental de los lectores en narraciones 
breves, similares a las utilizadas en los experimentos de emociones referidos anteriormente. 
Veamos un ejemplo de narración. 
El encuentro con el primo 

Antonio iba a encontrarse con su primo al día siguiente, en una reunión familiar. Hacía 

mucho tiempo que no sabía nada de él. Ese primo fue el triunfador de la familia. 

Cuando Antonio era niño, todos se lo ponían de ejemplo, pues sacaba siempre buenas 

notas, era el más simpático y sociable de todos y el mejor deportista del colegio. Por el 

contrario, Antonio era un niño tímido que pasaba desapercibido en todo. Por eso, 

Antonio no tenía buenos recuerdos de él. 

Antonio empezó a pensar: «Seguro que tiene un precioso chalé de lujo y habrá 

triunfado en todo. En cambio, yo siempre me he quedado a medias. Cómo me gustaría 

que fuera al revés». 

Entonces alguien le dijo a Antonio que, en realidad... [1a] 

Nadie le había dicho a Antonio que, en realidad... [1b] 

su primo se había convertido en un drogadicto, tenía el sida y llevaba una vida 

miserable. 

Al dirigirse a la reunión familiar Antonio sintió lástima de su primo. [2a] 

Al dirigirse a la reunión familiar Antonio sintió envidia de su primo. [2b] 
La primera parte de la historia induce al lector a representarse un determinado estado 
emocional del protagonista (p. ej., envidia), aunque no se mencione explícitamente. Luego 
figura una información crítica que cambia el tono emocional de la historia (el primo ya no es el 
triunfador de antaño, sino un fracasado). La manipulación fundamental es que en una versión 
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de la historia el protagonista conoce esta información crítica [la], mientras que en otra versión 
la ignora [1b]. Por último, se incluye una frase con una etiqueta emocional al final de la 
historia que es coherente con la versión de protagonista informado [2a] o con la versión de 
protagonista ignorante [2b]. Como variable dependiente se registró el tiempo de lectura de esa 
frase crítica. Los resultados mostraron que cuando el protagonista «conocía» la información 
crítica, los lectores leyeron más deprisa la frase que concordaba con dicha información 
(lástima). Por el contrario, cuando el protagonista era «ignorante» de la información crítica, 
los lectores leyeron más rápidamente la frase relacionada con la emoción inicial (envidia). 
Estos resultados indican que el lector es capaz de ponerse en el punto de vista mental del 
protagonista a pesar de que dispone de una información privilegiada sobre la situación. 

No sólo aplicamos nuestras habilidades sociales en la comprensión, sino que la lectura de 
narraciones puede, a su vez, afinar nuestras habilidades sociales, como sugiere el recuadro 9-4, 


Recuadro 9-4. ¿Puede la lectura de una narración literaria mejorar nuestra 


sensibilidad emocional? 


Las grandes narraciones literarias son como la vida misma, al menos en cierto sentido. El lec- 
tor se enfrenta a múltiples personajes, y cada uno ofrece una perspectiva particular de los acon- 
tecimientos. Cada uno tiene su personalidad, sus metas, intenciones, sentimientos y emociones; 
unos conocen ciertos acontecimientos y otros los ignoran; algunos son amigos o familiares, otros 
tienen un trato superficial o son meros desconocidos y otros, en fin, son enemigos. El lector debe 
ser capaz de representarse este complejo mundo interpersonal, aplicando su teoría de la mente 
como lo hace en las situaciones de la vida real. De hecho, las grandes narraciones literarias pro- 
porcionan una experiencia interpersonal vicaria más densa y compleja de la que solemos tener en 
nuestra vida diaria y obligan al lector a ejercitar al máximo su teoría de la mente. 


Kidd y Castano (2013) realizaron varios experimentos con grupos de participantes igualados 
en conocimientos literarios. Algunos grupos recibieron una narración literaria, otros recibieron 
una narración popular (tipo best-seller, y otros un texto expositivo. Después de leer el texto 
asignado, respondían al Test de lectura de mente a partir de los ojos (Reading the Mind in the 
Eyes Test [RMET]), un test que mide la capacidad de evaluar los estados afectivos de los demás. 
La tarea del RMET consiste en juzgar expresiones emocionales a partir de fotografías que sólo 
muestran los ojos de actores y actrices. Sorprendentemente, los que leyeron la narración literaria 
puntuaron significativamente más alto en el test (media = 26) que los que leyeron la narración 
popular (media = 23) o el texto expositivo (media = 23,5). 


Los experimentos de Kidd y Castano demuestran, quizá mejor que ningún otro, que la lectura 
de narraciones literarias (no así las populares) induce experiencias interpersonales tan realistas 
que por un momento incluso mejoran nuestras capacidades para interpretar las expresiones 
faciales. Otros estudios con medidas correlacionales también sugieren que las personas que habi- 
tualmente leen narraciones literarias amplían de modo permanente su capacidad para compren- 
der los estados mentales de los demás, tanto desde el punto de vista emocional como cognitivo. 


e Conclusiones 
Los estudios empíricos revisados en este apartado demuestran que es posible capturar algunas 
de las características estructurales y funcionales de los modelos de situación, con métodos en 
línea. En primer lugar, los modelos de situación incluyen una representación espacial muy 
simplificada, pero claramente diferenciada de la propia estructura del texto. En segundo lugar, 
los modelos de situación incluyen características temporales que están apuntaladas por 
numerosos índices morfológicos, léxicos y sintácticos del propio texto. La organización 
temporal es incluso más importante que la espacial dada la prioridad que tiene en el lenguaje. 
En realidad, el tiempo es una dimensión transversal que subyace a muchas facetas 
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representadas en los modelos de situación, como las acciones motoras, las emociones, los 
eventos, etc. En tercer lugar, dado que las narraciones tratan especialmente de personas, de sus 
acciones y de las cosas que les suceden, los mecanismos propios de la cognición social, como 
la empatía y la teoría de la mente, intervienen activamente en su comprensión. Gracias a estos 
mecanismos cognitivos, el lector de narraciones infiere y actualiza las emociones y los estados 
de conocimiento de los protagonistas, disociándolos de los propios, y entiende los vínculos 
interpersonales entre ellos. 


TEORÍAS SOBRE LA COMPRENSIÓN DEL DISCURSO 
Hasta ahora se han descrito los fenómenos emergentes del discurso y se han revisado algunas 
investigaciones representativas sobre los modelos de situación. Se trata de una información 
esencialmente empírica y fragmentaria, pero es preciso organizaría e integrarla en un marco 
teórico que nos permita explicar los datos. Veamos a continuación las principales teorías que 
intentan realizar esta labor integradora y explicativa. 

e Aportaciones de Walter Kintsch 
Walter Kintsch ha sido uno de los psicólogos cognitivos más influyentes en las últimas 
décadas. Sus contribuciones tienen implicaciones para la psicología de la memoria y del 
pensamiento, pero sobre todo para la psicología del discurso. A lo largo de los años ha 
desarrollado, junto a algunos colaboradores, varias formulaciones teóricas de gran impacto en 
la investigación básica y aplicada: la teoría de la macroestructura (Kintsch y Van Dijk, 1978), 
la teoría de la construcción-integración (Kintsch, 1988) y la teoría de la memoria de trabajo 
(Ericsson y Kintsch, 1995). 
Teoría de la macroestructura 
La primera teoría sobre la comprensión del discurso (Kintsch y Van Dijk, 1978) proponía que 
durante el proceso se elaboran dos tipos de estructuras semánticas: la microestructura y la 
macroestructura. La microestructura corresponde a la organización local del discurso e incluye 
un conjunto de microproposiciones correferentes (con argumentos repetidos) extraídas a partir 
de las oraciones del texto, que mantienen una relación jerárquica entre sí. La macroestructura, 
por su parte, es la organización global que le da unidad de sentido al discurso, lo que 
intuitivamente denominamos el argumento de una narración o el tema de una conversación. La 
macroestructura se describe en términos de macroproposiciones y se refiere a los mismos 
contenidos que la microestructura pero desde un punto de vista más global o «tópico». Cuando 
hemos comprendido correctamente un texto, la macroestructura es lo que retenemos en la 
memoria. Según Kintsch y Van Dijk, la transformación de microestructura en macroestructura 
la consigue el lector u oyente aplicando macrorreglas que básicamente reducen y organizan la 
información de la microestructura. Estas reglas son: 

+ Borrado-, si una proposición no tiene vinculación alguna como antecedente con las 

siguientes proposiciones, debe borrarse. 
+  Generalización-, una secuencia de proposiciones puede ser sustituida por la proposición 
general de orden superior. 
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+  Construcción-, una secuencia de proposiciones puede ser sustituida por una proposición 
que denota un hecho global, del cual los hechos denotados por las proposiciones de 
microestructura son condiciones, componentes o consecuencias normales. 

Las macrorreglas se aplican no sólo a las proposiciones de la microestructura, sino también, 
recursivamente, a las proposiciones de la macroestructura generadas con anterioridad. Para 
evitar que ese proceso recursivo se aplique indefinidamente y produzca generalizaciones 
excesivamente abstractas y carentes de significado, la aplicación de las macrorreglas está 
controlada por un esquema de discurso. Por ejemplo, el lector puede utilizar de arriba-abajo su 
esquema de narración cuando lee una novela, su esquema de argumentación cuando lee un 
debate científico o su esquema de artículo cuando lee un artículo científico. Los esquemas de 
discurso operan de arriba-abajo, es decir, a partir de la memoria a largo plazo del lector. Por 
otra parte, aunque las macrorreglas son dispositivos de reducción de información, Kintsch y 
Van Dijk reconocen que, durante la comprensión, el lector u oyente añade proposiciones que 
no se extraen directamente del texto, sino que proceden de la memoria a largo plazo. En otras 
palabras, algunas proposiciones son el resultado de inferencias que añaden información no 
explícita en el texto base. 

Las estructuras del texto son procesadas en ciclos de memoria de trabajo. Cada ciclo se inicia 
en los límites entre cláusulas o, cuando éstas son muy largas, entre sintagmas, extrayéndose las 
proposiciones de microestructura y aplicándose las macrorreglas para generar la 
macroestructura. Dadas las limitaciones de la memoria de trabajo, el número de proposiciones 
procesadas en cada ciclo es pequeño, y depende de las capacidades de memoria del lector y de 
las propias características del texto. Parte de la memoria de trabajo es un retén donde se 
seleccionan un subconjunto de las proposiciones en cada ciclo, que se mantienen hasta el 
siguiente ciclo para verificar su correferencia y aplicar las macrorreglas. 

Teoría de la construcción-integración 

La nueva teoría de construcción-integración fue formulada por Kintsch en 1988, y recoge 
importante características de la teoría de  macroestructura. Concretamente, las 
representaciones siguen siendo conceptuales o preposicionales. También sigue habiendo dos 
fases en la comprensión del discurso: la construcción relacionada con la extracción de 
proposiciones a partir del texto superficial (equivalente a la microestructura), y la integración, 
que supone una reducción de información para alcanzar la comprensión (equivalente a la 
macroestructura). Se mantiene la idea de procesamiento en ciclos de memoria de trabajo, pero 
hay importantes diferencias entre ambas teorías, especialmente en cuanto a los procesos. En la 
teoría de la construcción-integración se eliminan las macrorreglas y, en su lugar, se proponen 
reglas débiles, en la tradición de los sistemas de producción (reglas condicionales del tipo «si 
se dan las condiciones X, Y, Z — realizar las operaciones A y B), y procesos de tipo 
conexionista en la red de información derivada del texto. 

Proceso de construcción. A diferencia de la teoría macroestructural, en la que la 
microestructura estaba compuesta por proposiciones «correctas», la construcción en la teoría 
de la construcción-integración es un proceso promiscuo que da lugar a multitud de 
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proposiciones, algunas apropiadas, pero también incompletas, redundantes e incluso 
contradictorias. Algunas proposiciones se derivan directamente del texto, pero otras se 
generan asociativamente y de arriba-abajo (inferencias) a partir de la red general de 
conocimiento del lector; además, se establecen vínculos asociativos entre las proposiciones 
generadas, configurando una red de tipo conexionista. Kintsch insiste en que este proceso es 
automático y principalmente guiado por el texto, y el resultado inmediato, un tanto caótico, es 
insuficiente para obtener un significado coherente del texto. A cambio, permite una enorme 
flexibilidad y una rápida adaptación a la información contextual del texto. 
Proceso de integración. La integración es un proceso que establece orden en el caos de 
información generado por la construcción. El mecanismo propuesto de satisfacción de 
constricciones es de tipo conexionista: la red activada anteriormente reajusta los pesos de sus 
conexiones, de modo que algunas se refuerzan, al acumular más vínculos positivos, y otras se 
debilitan y desaparecen. El resultado se integra a la macroestructura previamente elaborada, y 
es una representación coherente o, al menos, más coherente que el texto base previamente 
activado. Supongamos que el homógrafo «banco» aparece en el siguiente texto: 

«Ayer, un pistolero se llevó todo el dinero de un banco». 
En la memoria del lector existirán para la palabra «banco» dos nodos conceptuales, cada uno 
de ellos con vínculos asociativos con otros nodos. Así, una acepción de banco (banco 1) tendrá 
conexiones asociativas con dinero, BBVA, Santander, La Caixa, cheque, cajero, hipotecas, 
asalto, robo, pistolero etc., mientras que la otra acepción (banco 2) tendrá conexiones con 
asiento, parque, acera, farola, descanso, etc. Además, habrá conexiones inhibitorias entre 
banco 1 y parque, asiento, etc., o entre banco 2 y dinero, hipoteca, etc. Kintsch propone que en 
la fase de construcción, inicialmente se activarán ambas acepciones, dando lugar a dos 
proposiciones en conflicto: 

Llevarse [pistolero, dinero, banco 1]. [a] 

Llevarse [pistolero, dinero, banco 2]. [b] 
Inicialmente, toda esta información dará lugar a una red asociativa, pero los procesos de 
propagación de activación determinarán que las conexiones de banco 1 se refuercen, al estar 
éste vinculado con conceptos explícitos en el texto (dinero) o implícitos (asalto, robo, 
asociados a pistolero), mientras que banco 2 quedará aislado en la red, sin conexiones 
positivas con otros conceptos, e incluso con conexiones inhibidoras procedentes de los 
conceptos activados; por lo tanto, la proposición [a] se mantendrá y la proposición [b] se 
suprimirá. Lo interesante es que este proceso no es «inteligente», por ejemplo no se basa en la 
aplicación del esquema mental de «asalto al banco», y menos en razonamientos conscientes, 
sino que ocurre de abajo-arriba, basado en el propio texto. El mismo tipo de proceso 
conexionista de propagación de activación se aplica a gran escala, a grupos de oraciones y, en 
última instancia, al texto entero, determinando qué proposiciones constituirán la 
macroestructura integrada (mayor peso asociativo acumulado en la red) y cuáles no. 
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Teoría de la memoria de trabajo a largo plazo 
Las teorías clásicas de la memoria de trabajo, apoyadas por múltiples experimentos, postulan 


que sólo somos capaces de retener de forma inmediata entre 4 y 7 unidades de información, 
por ejemplo dígitos, y sólo durante unos segundos. Sin embargo, estas limitaciones parecen 
contradecir el rendimiento de nuestra memoria en la comprensión de narraciones y en otras 
tareas. Por ejemplo, nos asombran las habilidades de memoria que tienen las personas expertas 
en un determinado dominio, y que exceden con mucho los límites de la memoria de trabajo. 
Así, los jugadores profesionales de ajedrez recuerdan patrones del tablero después de una 
simple ojeada, los médicos recuperan la información de decenas de pacientes con un solo 
vistazo a su historial o al mirarles a la cara, los expertos en fútbol recuerdan con detalle las 
jugadas de un partido que sólo han visto una vez, los camareros pueden registrar mentalmente 
varios pedidos sin confundir unos con otros, etcétera. 

En 1995, Ericsson y Kintsch plantearon una teoría revolucionaria sobre la memoria de trabajo 
que intenta resolver el conflicto entre los estudios clásicos de laboratorio y los estudios sobre 
la memoria de narraciones y la memoria de expertos. Estos autores postularon que, además de 
la memoria de trabajo convencional (memoria de trabajo a corto plazo), existe una memoria de 
trabajo a largo plazo, que es específica de dominio y se adquiere mediante entrenamiento 
continuado. Así, los jugadores expertos de ajedrez adquieren una memoria de trabajo a largo 
plazo específica de su habilidad particular, tras muchos años de práctica. En el caso de la 
comprensión del discurso, también se aprecia el funcionamiento de la memoria de trabajo a 
largo plazo. Varias horas o días después de haber leído un capítulo retomamos la lectura y, tras 
leer algunas oraciones, recuperamos el contexto narrativo (macroestructura) con increíble 
facilidad. Sin duda, esto no sería posible si nos basásemos sólo en los trazos de la memoria a 
corto plazo, que típicamente se desvanecen en cuanto somos interrumpidos con nueva 
información no relacionada. La tolerancia de la memoria de trabajo a largo plazo a la 
interrupción es precisamente uno de sus rasgos distintivos. 

Lo que hacen el experto y el lector de narraciones es utilizar estructuras de recuperación 
almacenadas en su memoria a largo plazo, que se activan cuando reciben ciertos índices. Por 
ejemplo, el jugador de ajedrez dispone en su memoria a largo plazo de gran número de 
patrones de juego de ajedrez almacenados (estructuras de recuperación), y en cuanto echa un 
vistazo a un tablero (índice) recupera toda la información asociada a dicho tablero (memoria 
de trabajo a largo plazo). En el caso de la lectura de narraciones, el lector construye 
macroestructuras de proposiciones fuertemente integradas y, cuando tras la interrupción lee 
una oración (índice) que se relaciona con la macroestructura, recupera fácilmente la 
información relevante. La memoria de trabajo a largo plazo es un mecanismo que nos libera de 
los estrechos límites estructurales y funcionales de la memoria a corto plazo. Esto implica un 
mensaje optimista para los educadores: la memoria de trabajo a largo plazo se puede mejorar 
sustancialmente con el entrenamiento ampliando nuestras capacidades cognitivas. Pero, como 
suele ocurrir, el precio para lograrlo es el esfuerzo continuado a lo largo del tiempo. Por otra 
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parte, la memoria de trabajo a largo plazo es específica del dominio entrenado y 
probablemente no se generaliza a otros dominios. 

Valoración de las aportaciones de Kintsch 

Las teorías de Kintsch ofrecen un gran avance para interpretar un fenómeno multidimensional 
y complejo como es la comprensión del discurso. La noción de niveles de representación del 
discurso, incluidos los modelos de situación, la distinción entre procesos de microestructura y 
de macroestructura, o de construcción e integración, el ajuste de los procesos a ciclos de la 
memoria de trabajo sintonizados con los sintagmas y cláusulas y, en fin, la reformulación de la 
memoria de trabajo incluyendo un componente a largo plazo son contribuciones 
extraordinarias a la psicología del lenguaje. 

Sin embargo, tan importante como lo que Kintsch explica es lo que no explica. Kintsch es muy 
consciente de los aspectos que quedan fuera de sus sucesivas teorías. Así, el análisis sintáctico 
de las oraciones o los procesos de codificación proposicional a partir del texto superficial no 
forman parte de las teorías, sino que se dan por supuestos. Las teorías no usan como input el 
texto superficial, sino las proposiciones ya elaboradas (el texto base), y a partir de ahí explican 
los procesos de microestructura y de macroestructura o de construcción-integración. Pero la 
codificación proposicional no la ejecuta un algoritmo, sino que lo hace el propio investigador 
«a mano». De modo general, los aspectos computacionales no están muy detallados. Por 
ejemplo, en la teoría de construcción-integración se menciona que la construcción se elabora 
aplicando reglas de producción, pero no se especifican ni siquiera hipotéticamente cuáles son 
esas reglas de producción. Asimismo, los procesos conexionistas que se aplican en la 
integración son más una «filosofía» que una propuesta formal de simulaciones efectivas. Da la 
impresión de que los mecanismos computacionales propuestos son herramientas provisionales 
más que aspectos esenciales en sus teorías. Prueba de ello es la facilidad con la que Kintsch 
adopta nuevas aproximaciones. Aunque sus teorías siguen utilizando las proposiciones como 
representaciones básicas del conocimiento, el hecho de no disponer de mecanismos de 
codificación automática de éstas lleva a Kintsch a adoptar las teorías estadísticas del 
significado, como el análisis semántico latente (latent semantic analysis, LSA), que se 
describirá más adelante. El LSA representa el significado de palabras, oraciones o textos como 
vectores en un espacio matemático. La gran ventaja de hacerlo así es que el cálculo de estos 
vectores «semánticos» y las relaciones entre ellos sí se hace de forma automática, mediante 
algoritmos matemáticos. 

A los problemas anteriores hay que añadir que el uso de las proposiciones como formato de 
representación es una decisión polémica, como se ha visto antes, especialmente por su 
ausencia de anclaje en el mundo. La posición epistemológica de Kintsch parece ser: 
avancemos todo lo posible en una concepción general de la comprensión del discurso, aun 
dejando detalles sin resolver o con una solución provisional, que se podría revisar más 
adelante. Este planteamiento pragmático es especialmente válido para un campo tan complejo 
como la comprensión del discurso. Permite establecer algunas piezas de conocimiento 
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importantes para seguir avanzando, olvidando por el momento aquellos problemas cuya 
solución parece fuera de nuestro alcance actual. 

+ Teorías de modelos de situación 
La noción de modelos de situación es generalmente aceptada por los investigadores del 
discurso, y aparece explícitamente en los trabajos de Kintsch que acabamos de mencionar. Sin 
embargo, en Kintsch la idea es algo difusa al postular el mismo código proposicional 
(simbólico, abstracto y lineal) tanto para el texto base como para los modelos de situación. Las 
propuestas que veremos a continuación son complementarias a las de Kintsch, al desarrollar 
con más detalle la idea de modelos de situación. 
Modelos de continuidad situacional 
La propuesta básica es que las oraciones de un texto generalmente mantienen continuidad en 
una serie de dimensiones situacionales, como el tiempo y el espacio, pero cuando se produce 
alguna discontinuidad en una o más de estas dimensiones hay un sobrecoste cognitivo. Quien 
expresó esta idea de forma explícita por primera vez fue Gernsbacher (1990) en su enfoque de 
construcción de estructuras. Según esta investigadora, cuando empezamos a leer una narración 
establecemos la «fundación de una estructura» (una forma un tanto aséptica de denominar un 
modelo de situación), activando «celdillas» de la memoria (una especie de nodos de memoria 
semántica). La fundación de una estructura implica un coste cognitivo considerable, que se 
manifiesta en la lenta lectura de las primeras oraciones o párrafos de una historia. La siguiente 
operación es el proceso de «mapeado de estructura», es decir que, a medida que leemos nuevas 
oraciones, completamos o enriquecemos la estructura fundada, pero esto sólo ocurre si se 
mantiene la continuidad o coherencia temporal, espacial, causal y de correferencia. Es decir, 
cuando los eventos descritos ocurren en el mismo lugar, de forma continua, mantienen 
relaciones causa-efecto, y se refieren a los mismos personajes, objetos, etcétera. 
Sin embargo, cuando aparece algún indicador de discontinuidad en el texto, el lector realiza un 
«cambio de estructura», es decir, deja de implementar la estructura anterior y funda una nueva 
estructura o subestructura, activándose nuevas celdillas de memoria. El cambio de estructura 
implica un incremento del coste cognitivo que se manifiesta en una lectura más lenta en ese 
punto del texto. Una vez realizado el cambio de estructura, la estructura anterior pierde 
accesibilidad en la memoria. Esto podría explicar las diferencias individuales en comprensión, 
ya que los lectores menos eficientes tienden a realizar más cambios de estructura que los más 
eficientes. ¿Qué determina el cambio de estructura? En opinión de Gernsbacher, en algunos 
casos hay marcas explícitas en el texto. Por ejemplo, «al día siguiente...» le indica al lector una 
discontinuidad temporal que le induce a cambiar de estructura; si el texto sitúa los eventos en 
la universidad y el lector lee «en la playa...», esta discontinuidad espacial también le llevaría a 
cambiar de estructura. Respecto a la causalidad, la continuidad puede estar marcada 
explícitamente en el texto mediante conectores causales y concesivos (porque, puesto que, así 
pues, por lo tanto, consecuentemente, etc.) y la discontinuidad puede estarlo por conectores 
adversativos (sin embargo, pero, a pesar de ello, etc.), aunque a menudo ni la continuidad ni la 
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discontinuidad causal presentan marcas explícitas, sino que el lector las infiere a partir de su 
conocimiento del mundo. 

Zwaan, Langston y Graesser (1995) propusieron el modelo de indexación de eventos que, en 
realidad, es una variante de la propuesta de Gernsbacher, a la que añaden el protagonista y la 
intencionalidad como dimensiones de la situación. Según ellos, al procesar el primer evento de 
la historia, el lector establece cinco índices: temporalidad, espacialidad, causalidad, 
protagonista e intencionalidad. En cada nuevo evento de la historia el lector supervisa estas 
dimensiones y las actualiza cuando hay algún cambio significativo. El protagonista o los 
protagonistas proporcionan, sin duda, continuidad situacional. Podemos leer páginas y 
capítulos enteros en los que se mantiene el protagonista en el foco narrativo (generalmente 
apoyado mediante anáforas en el texto), contribuyendo a implementar el modelo de situación. 
Sin embargo, la irrupción de un nuevo protagonista contribuiría a la discontinuidad, 
iniciándose una nueva estructura o modelo de situación. Relacionado con lo anterior está la 
intencionalidad, es decir las metas y los planes de los protagonistas, que contribuyen a 
proporcionar unidad al modelo de situación y que se ponen al día cuando hay un cambio 
significativo. 

Teoría de la experiencia de inmersión 

Zwaan (2004) propuso la teoría de la experiencia de inmersión con un afán integrador. Así, la 
teoría incorpora muchas de las ideas de Kintsch y sus colaboradores sobre los procesos de 
comprensión del discurso, pero con una diferencia importante: sustituye las proposiciones de 
Kintsch por representaciones corpóreas como formato de los modelos de situación. En este 
sentido también asume algunas características de las teorías de cambio de estructuras y del 
modelo de indexación de eventos, que acabamos de describir, e incluye asimismo ideas 
propias de la lingilística cognitiva. La experiencia de inmersión se basa en el supuesto según el 
cual la memoria de trabajo del lector u oyente refleja la accesibilidad de los objetos y eventos 
narrativos de modo muy similar a como lo hace en la experiencia real. Es decir, tenderán a 
mantenerse en memoria los objetos presentes en la situación más que los ausentes, las 
características presentes más que las ausentes, los objetos próximos más que los distantes, los 
eventos en curso más que los pasados, las metas actuales más que las pasadas o las entidades 
visibles más que las ocultas. Zwaan propone tres componentes en la comprensión: activación, 
interpretación e integración, que corresponden a grandes rasgos al procesamiento léxico, de la 
cláusula y del discurso, respectivamente. 

La activación es un proceso que se dispara con cada palabra y, al igual que la construcción de 
Kintsch, es difusa y caótica. Sin embargo, a diferencia de Kintsch no son proposiciones las que 
se activan sino trazos de experiencia sensoriomotores. Por ejemplo, la palabra «águila» en la 
oración «el biólogo vio el águila en el cielo» activará redes difusas en la corteza visual 
correspondientes a nuestras experiencias pasadas con las águilas, desde diversas perspectivas, 
distancias y configuraciones (p. ej., con las alas plegadas o abiertas). 

La interpretación (en inglés, construat) resulta de combinar las activaciones de las redes 
difusas activadas por las palabras de una cláusula, siguiendo un mecanismo de satisfacción de 
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múltiples constricciones, análogo al mecanismo conexionista propuesto por Kintsch en su 
teoría de la construcción-integración. La interpretación es ya una simulación experiencial 
concreta. Por ejemplo, las activaciones difusas y contradictorias de «águila» se resuelven en el 
contexto de la oración anterior manteniendo una única representación visual (p. ej., un águila 
con las alas abiertas y vista desde abajo) y eliminándose otras (p. ej., el águila con las alas 
plegadas). Cada proceso de interpretación está sintonizado con una unidad de entonación del 
habla y se puede considerar un «marco atencional», como propone el lingiista Langacker 
(2001). Es decir, los límites prosódicos del habla, muchas veces coincidentes con los de las 
cláusulas gramaticales, son marcadores lingúísticos naturales de los procesos de 
interpretación. Una interpretación es como un plano cinematográfico, que implica una ubica- 
ción temporal y espacial de los personajes, objetos y eventos, y una perspectiva determinada 
(p. ej., la del protagonista) que proporciona mayor prominencia a unas entidades sobre las 
otras. 
El proceso de integración ocurre a medida que avanza el texto, y el lector procede con la 
ejecución de nuevas interpretaciones (In —> In,; —> In,,.... Iny+z) derivadas de las cláusulas o 
unidades de entonación. Pero este proceso ocurre de forma integrada; por ejemplo, la 
interpretación In,, utiliza una parte de la interpretación In que está activa en la memoria de 
trabajo, combinada con las redes funcionales asociadas con las palabras procesadas 
actualmente. La integración implica la transición de una interpretación a la siguiente. De 
nuevo se asume que esas transiciones se basan en la experiencia. Veamos el siguiente 
fragmento de la novela de Noah Gordon El médico, ambientada en la Edad Media, en el que se 
describe un incidente del protagonista Rob Colé en su largo viaje desde Inglaterra hasta Persia: 
«Habían rodeado una curva del sendero (In,) y Rob cumplía su turno (In,) a la cabeza 
de la marcha (Inz) cuando su burro se espantó (In4). Por encima de ellos (In;), en una 
rama gruesa (Ins), acechaba un leopardo (Ing) [...] Mientras Rob manoteaba en busca 
de un arma (In,), el animal que le pareció monstruoso (Ing) saltó sobre él (Ino). Una 
saeta larga y pesada (Ino), disparada con tremenda fuerza (In;,), dio en el ojo derecho 
de la bestia (In;>)». 
Cada una de las interpretaciones (etiquetadas como In, a In,>) corresponde a un marco 
atencional, pero todas ellas conforman una secuencia de transiciones coherentes, desde la 
perspectiva experiencial del protagonista Rob. Así, hay coherencia temporal: la secuencia de 
interpretaciones ocurre de forma continua. También hay continuidad causal; por ejemplo, el 
lector descubre que la causa de In, es Ing. A veces el foco atencional cambia de los eventos 
externos a estados internos (Ing). Algunos eventos, como Injo-[n;,, abren una expectativa en el 
lector, pues requieren una explicación causal que queda de momento en suspenso. El lector es 
como un espectador al que el texto va guiando en el procesamiento de interpretaciones y su 
integración en una escena coherente. La continuidad (temporal, espacial, causal, de 
protagonista e intencional) se asume por defecto, pero, como hemos visto en los modelos de 
continuidad situacional, en el texto puede haber marcas de discontinuidad, que obligan al 
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lector a reiniciar los procesos de interpretación e integración, con el consiguiente coste 
cognitivo y aumento del tiempo de lectura. 

+ Teorías estadísticas: análisis semántico latente 
Landauer y Dumais (1997) elaboraron una teoría denominada análisis semántico latente 
(LSA), basada en la idea de que las pautas de uso del lenguaje revelan información semántica. 
La teoría analiza estadísticamente la coocurrencia de las palabras en textos naturales. 
Inicialmente, los autores registraron, mediante un programa de ordenador, las ocurrencias de 
unas 60.000 palabras en unos 30.000 textos, formando una inmensa matriz de palabras (filas) x 
textos (columnas), cuyas celdillas incluían las frecuencias de ocurrencia. Los cálculos 
matemáticos posteriores, mediante la técnica de descomposición en valores singulares, 
permiten reducir la matriz a un espacio vectorial de sólo unas 300 dimensiones. Las palabras 
están representadas en ese espacio como vectores, y las relaciones entre un par de palabras se 
calculan como el coseno del ángulo entre sus vectores. A su vez, la longitud de cada vector es 
un indicador de la riqueza semántica de la palabra. Lo interesante de este procedimiento es que 
los cosenos obtenidos matemáticamente tienen propiedades psicológicas emergentes. Por 
ejemplo, el coseno entre dos palabras predice los juicios de similitud de los participantes 
humanos, los efectos de priming, estima el grado de sinonimia entre las palabras, se relaciona 
con la edad de adquisición, etc. Más aun, los vectores de las palabras de una oración o de un 
texto pueden combinarse en nuevos vectores que representan estas unidades de discurso. 34 
Cuando se dispone de una interfaz apropiada, el usuario de LSA puede comprobar por sí 
mismo las relaciones semánticas (cosenos), no sólo entre palabras, sino entre oraciones o entre 
textos. Así, en castellano hay una aplicación LSA elaborada por José A. León y sus 
colaboradores de la Universidad Autónoma de Madrid. 
En términos estrictos, el LSA es una herramienta estadística que explota datos procedentes de 
corpus lingúísticos. Sin embargo, Landauer y Dumais afirman que el LSA es una auténtica 
teoría del significado. Según ellos, los seres humanos funcionamos en gran medida como el 
LSA,; así, el significado de la mayoría de las palabras se adquiere a partir de su relación con 
otras palabras en contextos puramente lingúísticos, por ejemplo durante la lectura. Un corpus 
amplio de textos en un determinado dominio sería análogo a la acumulación de experiencia de 
las personas en ese dominio; en otras palabras, el lenguaje es un espejo de la experiencia. Por 
lo tanto, las relaciones semánticas derivadas estadísticamente de los textos reflejan 
directamente el conocimiento de las personas. La información sobre el mundo contenida en la 
estadística de las palabras no es nada despreciable. Por ejemplo, Louwerse y Zwaan (2010) 
aplicaron el LSA a 50 nombres de ciudades norteamericanas, a partir de un corpus de artículos 
del New York Times y de otros periódicos. A partir de las coocurrencias en los textos se 
obtuvieron los cosenos entre los vectores correspondientes a dichas ciudades, y posteriormente 
se aplicó a estos cosenos un análisis multidimensional. Lo sorprendente es que los valores 
dimensionales obtenidos para las ciudades correlacionaron con su longitud y latitud 
geográficas (0,368 y 0,413, respectivamente, a partir de los datos del New York Times), y aun 
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más con la longitud y la latitud estimadas por un grupo de participantes (0,415 y 0,590, 
respectivamente). 
Por otra parte, el LSA es una tecnología cognitiva, que se aplica en el análisis y la evaluación 
automática de textos. Por ejemplo, Olmos et al. (2011) crearon un algoritmo de LSA, que 
combina cosenos y longitud de los vectores, capaz de evaluar resúmenes de textos redactados 
por estudiantes de bachillerato. Los autores calcularon mediante el LSA la similitud entre los 
resúmenes y los textos originales, y también pidieron a un grupo de expertos que valorasen 
dichos resúmenes. Los resultados indicaron que los valores de LSA correlacionaron con la 
valoración de los expertos entre 0,41 y 0,63, dependiendo del tipo de texto. Kintsch (1998) 
también aplicó el LSA como una herramienta complementaria de su teoría de la 
construcción-integración. Los conceptos y las proposiciones derivadas del texto se expresan 
como vectores de LSA, y de este modo uno de los déficits de las proposiciones (la ausencia de 
un algoritmo que las codifique) queda subsanado: el conocimiento se puede extraer 
automáticamente a partir de los textos mediante un algoritmo de LSA. Todas estas son 
cualidades muy valiosas, pero no debe olvidarse que el LSA no es una teoría completa de la 
comprensión del lenguaje. Así, el LSA no analiza las palabras gramaticales (pronombres, 
artículos, preposiciones, etc.), ni tampoco los procesos sintácticos, ni el orden de las palabras. 
Tampoco tiene en cuenta los mecanismos cognitivos implicados en la comprensión, como la 
memoria de trabajo, o los procesos atencionales. Sin embargo, el LSA pone el acento en un 
aspecto importante del procesamiento del lenguaje que puede tener relevancia psicológica: los 
lectores u oyentes podrían realizar un cómputo automático de la coocurrencia de las palabras, 
como una especie de atajo cognitivo que los lleva a realizar inferencias probables. Pero la 
comprensión del significado difícilmente se puede reducir a ese cómputo estadístico de 
palabras, y requiere, entre otras cosas, establecer la referencialidad de los contenidos, es decir, 
anclarse en el mundo. 

+ Teorías neurológicas 
Las teorías cognitivas sobre la comprensión del discurso se basan principalmente en estudios 
conductuales. Sin embargo, en los últimos años se ha incrementado el número de 
investigaciones neurocientíficas sobre la comprensión del discurso. Estos estudios pueden 
contribuir a refinar las teorías alineándolas con los datos de la neuroanatomía, de la 
neurofisiología y del estudio de pacientes con lesiones cerebrales. De este modo, podrían 
consolidarse algunas teorías funcionales o bien desecharse o modificarse algunos postulados 
teóricos que no obtengan confirmación neurológica. Por otra parte, los datos neuroanatómicos, 
extraordinariamente ricos y multidimensionales, pueden por sí mismos contribuir a configurar 
teorías cognitivas nuevas. 
Papel del hemisferio derecho 
La comprensión y la producción del lenguaje se han asociado tradicionalmente a la actividad 
del hemisferio cerebral izquierdo, en particular las áreas perisilvianas de Broca (corteza frontal 
inferior) y de Wernicke (corteza temporal superior, circunvolución angular). Sin embargo, los 
estudios neurocientíficos muestran que el hemisferio cerebral derecho desempeña un papel 
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relevante en la comprensión, especialmente del discurso. Así, los pacientes con lesiones en el 
hemisferio derecho, aunque no presentan síntomas afásicos, tienen dificultades para extraer las 
ideas principales de una narración, realizar inferencias, comprender metáforas, etc. (véase cap. 
12). Los estudios de neuroimagen realizados con individuos sanos revelan, a su vez, que 
durante la comprensión del discurso se activan, además de las áreas clásicas del hemisferio 
izquierdo, algunas regiones del hemisferio derecho. Por ejemplo, Robert-son et al. (2000) 
realizaron un estudio de neuroimagen en el que los participantes recibían conjuntos de 
oraciones que incluían artículos indeterminados o bien artículos determinados como las de la 
tabla 9-3. 


Tabla 9-3. Ejemplos de oraciones utilizadas por Robertson et al. (2000) 


Artículos indeterminados Artículos determinados 
Una abuela se sentó a una mesa La abuela se sentó a la mesa 
Un niño jugaba en un patio El niño jugaba en el patio 
Una madre hablaba en un teléfono La madre hablaba al teléfono 
Un marido conducía un tractor El marido conducía el tractor 
Un nieto gateó hacia una puerta El nieto gateó hacia la puerta 
Un nene hacía pucheros y se aburría El nene hacía pucheros y se aburría 
Una abuela prometió cocinar una tarta La abuela prometió cocinar tarta 
Una esposa miró hacia un campo La esposa miró hacia el campo 
Unas nubes oscuras se acercaban rápidamente Las nubes oscuras se acercaban rápidamente 
Una madre se preocupaba por una cosecha La madre se preocupaba por la cosecha 
Una abuela abrió una puerta La abuela abrió la puerta 
Empezó a caer alguna lluvia Empezó a caer la lluvia 
Un día de trabajo terminó pronto El día de trabajo terminó pronto 
Una familia corrió sobre un campo mojado La familia corrió sobre el campo mojado 


La versión con artículos indeterminados se lee como un conjunto de oraciones independientes, 
mientras que las oraciones con artículos determinados son correferentes y, por lo tanto, se leen 
como una narración. Los resultados mostraron activaciones en las áreas perisilvianas del 
hemisferio izquierdo en ambas versiones, pero, además, en la versión de narración se activó la 
región del hemisferio derecho homologa del área de Broca, indicando que la integración del 
discurso requiere la colaboración del hemisferio derecho. 

La teoría más completa sobre el papel del hemisferio derecho fue desarrollada por Mark 
Beeman (1998), quien postula que ambos hemisferios están especializados en diferentes 
procesos semánticos relacionados con la comprensión del lenguaje. Al procesar las palabras, 
el hemisferio izquierdo realiza una codificación semántica fina, es decir, activa intensamente 
campos semánticos reducidos, dominantes y relacionados con el contexto inmediato. El 
hemisferio derecho, en cambio, realiza una codificación semántica gruesa, activando 
débilmente campos semánticos mucho más amplios pero también difusos y mal estructurados. 
En la mayoría de las tareas del lenguaje (reconocimiento de palabras, comprensión de 
oraciones literales, inferencias prealmacenadas, etc.) el hemisferio izquierdo es más eficiente 
que el derecho, llevando a cabo un procesamiento rápido y apropiado. Sin embargo, cuando se 
trata de formas de lenguaje más sofisticadas, como capturar el sentido del discurso, entender 
metáforas nuevas, comprender el humor, o realizar inferencias elaborativas, el hemisferio 
derecho ofrece ventajas. En todos estos casos es muy probable que los campos semánticos 
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difusos de multitud de palabras activados en el hemisferio derecho se solapen y permitan una 
resolución del significado; por el contrario, los campos semánticos reducidos y especializados 
del hemisferio izquierdo fracasan en la construcción de una representación coherente e 
integrada. En realidad, ambos hemisferios cooperan y combinan información a través de la 
rica conectividad proporcionada por el cuerpo calloso. 

La teoría de Beeman se ajusta bastante bien a los procesos postulados por la teoría de la 
construcción-integración de Kintsch. La construcción, como proceso de activación difuso y 
caótico, responde casi exactamente al papel del hemisferio derecho, mientras que la 
integración como un proceso de constricciones múltiples que elimina activaciones irrelevantes 
es más propia del carácter selectivo del izquierdo. Sin embargo, la división del trabajo entre 
ambos hemisferios es un tanto gruesa y, según algunos autores, gran parte de las funciones 
lingúísticas atribuidas al hemisferio derecho podrían tener relación más bien con el lóbulo 
frontal en general o con el lóbulo temporal, sin una lateralización clara. 

Papel de otras estructuras cerebrales 

Los datos procedentes de la neurociencia del discurso son extremadamente ricos y ofrecen 
muchas posibilidades interpretativas. Pensemos en la noción cognitiva de modelos de 
situación. Son representaciones multidimensionales que incluyen aspectos sensoriomotores, 
emocionales e interpersonales que proporcionan el carácter «experiencial» a la comprensión 
de narraciones. 


Recuadro 9-5. Palabras, oraciones y narraciones 


La técnica de neuroimagen más popular es la 


resonancia magnética funcional (RMf), que re- Palabras frente a series de letras 
gistra los cambios hemodinámicos en el cerebro, : : 
supuestamente relacionados con la actividad 0 0. 
neuronal, mientras el individuo realiza tareas NA 

cognitivas. Esto proporciona imágenes muy pre- á y 2 


cisas de las estructuras cerebrales implicadas en 
las tareas. Xu et al. (2005) registraron imágenes 
de RMf mientras los participantes leían series de 
letras, palabras aisladas, oraciones inconexas o 
narraciones. Al sustraer las imágenes entre pa- 
res de condiciones se obtuvo la actividad neuro- 
nal específica de cada una de ellas. Los resulta- 
dos se muestran en la figura 9-7. a) D 


Oraciones frente a palabras 


(3 
O 


e Las palabras activaron sólo áreas en el he- 

misferio izquierdo, especialmente en la cor- Textos frente a oraciones 

teza temporal media y el área premotora. 

Las oraciones activaron más extensamente la y é ; 

corteza temporal, incluida la región temporal ) BOO e) 

media en ambos hemisferios. 

e las narraciones activaron una amplia red 
neuronal en ambos hemisferios, incluidas 
las áreas temporoparietales, la corteza fron- Figura 9-7. Regiones activadas en la corteza en 
tal medial, la ínsula, el precuneus y el hipo- función del nivel de la tarea lingúística. Tomado de 
campo. Xu et al. (2005). 


e 
O 


Q 


Por lo tanto, cabría esperar que durante la comprensión se activen, efectivamente, redes 
neurales visuales, auditivas, motoras, emocionales etc. Pero, ¿es esto cierto? En un 
metaanálisis realizado sobre 23 estudios de neuroimagen que contrastaban la comprensión del 
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discurso con la comprensión de oraciones inconexas o incoherentes, Ferstl et al. (2008) 
informaron de la existencia de activaciones compartidas en el área de Broca, pero también en 
áreas con una amplia distribución cerebral, incluyendo ambos hemisferios, por ejemplo, 
activaciones bilaterales en el lóbulo temporal anterior, la unión temporoparietal, el surco 
temporal superior y en estructuras de la corteza medial, como el precuneus y la corteza 
prefrontal dorsomedial. Lo interesante es que muchas de estas regiones tienen que ver con la 
teoría de la mente, es decir, con la capacidad de entender los estados mentales de los demás. 
Esto es justamente lo que cabría esperar de la comprensión de narraciones que demandan una 
toma de perspectiva mentalista (Recuadro 9-5 y véase «Dimensión emocional e interpersonal» 
antes, en este capítulo). 
Otros estudios sugieren que también las estructuras cerebrales relacionadas con las emociones 
(ínsula, amígdala) o con las acciones motoras (corteza motora y premotora) se activan durante 
la comprensión de textos narrativos. De modo general, los datos neurológicos parecen avalar 
la noción de modelos de situación como representaciones experienciales o corpóreas, pero 
también confirman el protagonismo de las áreas perisilvianas clásicas situadas en el 
hemisferio izquierdo. 

* Conclusiones 
Las teorías del discurso pueden parecer demasiadas y demasiado heterogéneas. Esto se debe, 
en parte, a la costumbre que tienen los autores de utilizar una terminología propia para 
describir ideas análogas, pero también porque hay diferencias sustanciales entre las teorías a la 
hora de explicar los fenómenos del discurso. La teoría de la construcción-integración de 
Kintsch es la más ambiciosa, cubriendo un amplio rango de fenómenos: los niveles de 
representación, la extracción de las ideas principales del discurso, la coherencia local y global, 
la funcionalidad de la memoria de trabajo en la comprensión o las inferencias. La teoría de 
construcción de estructuras de Gernsbacher hace hincapié en el funcionamiento de los 
procesos de coherencia (continuidad) y los efectos de las marcas de discontinuidad durante la 
comprensión en línea. También hace predicciones precisas sobre las consecuencias de la 
continuidad o la discontinuidad en el recuerdo del texto. La teoría de la experiencia de 
inmersión de Zwaan es, en cierta medida, un ensayo de reformulación de la teoría de la 
construcción-integración de Kintsch, pero incorporando mecanismos corpóreos 0 
experienciales de representación del significado, en lugar de las proposiciones simbólicas. Sin 
duda, la teoría más divergente es el LSA, puesto que se basa en el análisis computacional del 
discurso más que en el estudio del comportamiento del lector u oyente. A cambio ofrece una 
poderosa tecnología cognitiva, que tiene aplicaciones en el campo educativo e instruccional. 
La neuro-ciencia ofrece nuevas herramientas de análisis a la psicología del discurso, pero está 
en una etapa relativamente temprana desde el punto de vista teórico y se plantea el desafío de 
sancionar las teorías funcionales procedentes de los estudios conductuales. 
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RESUMEN 


El capítulo se centra principalmente en la comprensión de narraciones escritas. 

En la comprensión del discurso emergen fenómenos nuevos: los niveles de 
representación, la coherencia y las inferencias. Las investigaciones han demostrado que 
en la comprensión de narraciones el lector construye y actualiza modelos de situación 
de carácter espacial, temporal, causal, emocional e interpersonal. 

Walter Kintsch desarrolló la teoría de la construcción-integración, que explica los 
procesos de coherencia e inferencias basándose en reglas difusas (sistemas de 
producción y procesos  conexionistas) aplicadas sobre representaciones 
proposicionales y que operan en ciclos de la memoria de trabajo. 

Otras teorías, como la de Rolf Zwaan, centran la atención en las representaciones 
experienciales que subyacen a los modelos de situación. Por su parte, las teorías como 
el LSA se basan en el análisis estadístico de corpus de lenguaje y aseguran que las 
coocurrencias de las palabras encierran una rica información semántica. 

Finalmente, la neurociencia del lenguaje ha desvelado las redes neurales que operan en 
la comprensión del discurso y que incluyen áreas corticales del hemisferio derecho y 
mediales, además de las áreas clásicas de Broca y Wernicke. 


Preguntas de reflexión 


¿En qué consisten los procesos de alineamiento que ocurren en la conversación? 


Define los conceptos de cohesión, correferencia, coherencia local y coherencia global. 3 9 


¿Qué significa que los modelos de situación son representaciones «singulares»? 
¿Qué es el principio de ¡conicidad temporal? 

¿Cómo opera la memoria de trabajo a largo plazo durante la comprensión? 

¿Qué factores determinan el proceso de cambio de estructuras según Gernsbacher? 
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Objetivos de aprendizaje 
Al finalizar el capítulo el alumno será capaz de: 
e Valorar la importancia del lenguaje oral en la vida humana. 
e Conocer las principales fuentes de evidencia en la investigación sobre producción oral. 
e Entender los procesos que intervienen en la producción oral. 
e Distinguir las principales características de los modelos de producción oral. 
e Comprender los principios que rigen la conversación. 


INTRODUCCIÓN 

La capacidad de hablar del ser humano se manifiesta en la producción de mensajes a través 

de oraciones significativas y gramaticalmente aceptables que se integran en un discurso 
coherente. Cualquier hablante nativo de una lengua articula unas 150 palabras por minuto en 
condiciones normales y puede duplicar el número si es urgido a ello (Maclay y Osgood, 
1959). Teniendo en cuenta que un adulto de educación media tiene un vocabulario activo en 
torno a los 30.000 vocablos (Levelt, 1989), y que éstos deben organizarse en unidades 
sintácticas, se comprende la magnitud de la empresa. Hablar es algo extraordinariamente 
presente en nuestras vidas, con independencia de nuestro sexo, edad, formación, cultura, 1 
condición social, etc. (Recuadro 10-1). 


Recuadro 10-1. ¿Hablan más las mujeres? 


Parece que no. Vivimos rodeados de tópicos que se alimentan a sí mismos. Resulta que si se 
mide con rigor, los hombres hablan tanto como las mujeres: unas 16.000 palabras diarias 
como promedio. Ha quedado demostrado en un estudio de varios años publicado en Science 
(Mehl, Vazire, Ramírez-Esparza, Slatcher y Pennebaker, 2007). Los autores, pertenecientes 
a tres universidades estadounidenses, inician el artículo con las siguientes palabras: 

El estereotipo de la locuacidad femenina está profundamente enraizado en la cultura 
occidental. En la primera edición de su libro [El cerebro femenino], la neuropsiquiatra 
Brizendine declaraba: «Una mujer utiliza unas 20.000 palabras cada día, mientras que un 
hombre usa unas 7.000». Desde entonces, estos números han circulado en televisión, radio y 
medios escritos (p. ej. CBS, CNN, National Public Radio, Newsweek, The New York 
Times, Washington Post). De hecho, la estimación 20.000 frente a 7.000 parece haber 
adquirido estatus de mito cultural ya que diferencias parecidas se han citado en los medios 
durante los últimos 15 años (Mehl et al., 2007, p. 82). 

Los autores constatan que, «en realidad, ningún estudio ha registrado de forma sistemática 
conversaciones naturales de grandes grupos de personas durante períodos dilatados de 
tiempo» (p. 82). 

Los investigadores diseñaron una grabadora portátil que automáticamente, cada 12 minutos 
y medio, se ponía en marcha de forma silenciosa y grababa 30 segundos seguidos. Los 
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participantes la llevaban consigo y se olvidaban de ella mientras hacían su vida diaria. Entre 
1998 y 2004 se grabó a un total de 396 personas, 186 hombres y 210 mujeres. Al transcribir 
las grabaciones en el laboratorio y hacer el recuento de las palabras pronunciadas por cada 
voluntario, quedaron patentes dos hechos: 

+ Las diferencias individuales eran enormes: desde gente muy parlanchína, que hablaba 
más de 40.000 palabras diarias, a gente taciturna, de menos de 5.000. 

+ Estas diferencias no guardaban relación con el sexo de los hablantes. El promedio 
general resultó de 16.215 palabras diarias para las mujeres y 15.669 para los hombres, 
una pequeña diferencia sin significación estadística. 

Estos datos son llamativos porque derriban un mito muy extendido que es origen de otras 
conclusiones sin base real. 


Así lo explica uno de los personajes de la espléndida novela de Javier Marías, Tu rostro 
mañana. Fiebre y Lanza, a propósito de la campaña británica que durante la Segunda Guerra 
Mundial alertaba de los peligros de hablar sin cuidado con los demás, por miedo a los espías 
nazis: 
Y de pronto se le pidió a la gente que lo apagara, ese motor; que dejara de respirar, 
[...] aquello por lo que vivimos y de lo que todos pueden disfrutar y valerse sin 
excepción, los pobres como los ricos, los incultos como los instruidos, los viejos como 
los niños, los enfermos como los sanos, los soldados como los civiles. Si algo hacen o 
hacemos todos que no sea una estricta necesidad fisiológica, si algo nos es verdad 
común en tanto seres con voluntad, eso es hablar, Jacobo. (J. Marías, 2002; p. 409). 
Un hecho que sorprende a primera vista, como suele ocurrir en casi todos los aspectos del 
lenguaje, es el contraste entre la enorme complejidad de los procesos involucrados en el acto 
de hablar y la facilidad con que lo llevamos a cabo cotidianamente. Sin embargo, esta 
aparente facilidad no debe hacernos olvidar el intricado entramado de operaciones mentales, 
muchas de ellas automáticas, que median entre el momento en que tenemos la intención de 
comunicar algo y su materialización en una cadena de sonidos articulados. 
Lo primero que hay que destacar es que, en líneas generales, la producción del lenguaje ha 
recibido menos atención que la comprensión del lenguaje dentro de la investigación 
psicolingúística, hasta el punto que durante muchos años ha sido considerada la «pariente 
pobre» de esta disciplina. Basta con hojear cualquier manual para comprobar la enorme 
desproporción de páginas dedicas a una y otra función. Sin embargo, nos referimos a los 
estudios sobre adultos sanos; otra cosa es el terreno de la adquisición del lenguaje o el de las 
afasias, en los que esta asimetría no es tan patente. 
La principal razón del desfase es que, desde el punto de vista metodológico, resulta más fácil 
estudiar la comprensión del lenguaje que su producción. En la primera, el experimentador 
tiene la posibilidad de controlar directamente el input —o elemento de entrada en el sistema 
de procesamiento—, seleccionando los estímulos y construyendo el material verbal de 
acuerdo con determinados requisitos para observar el efecto de una o varias variables 
independientes. En la producción, el input lo constituye la supuesta intención de comunicar 
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algo por parte del hablante y su representación inicialmente no lingiiística del contenido del 
mensaje que desea transmitir. De manera que el acceso y el control experimental de ese input 
son indiscutiblemente más complicados en este caso. Por el contrario, en la producción 
lingúística está directamente disponible el output, o resultado último del proceso, es decir, la 
cadena final de sonidos que constituyen el habla —o la secuencia de signos gráficos en el 
caso de la escritura-, mientras que, en la comprensión, ese output final no es directamente 
observable y debe ser inferido a partir de las respuestas del participante en la tarea 
experimental. Esta circunstancia ha sesgado durante bastantes años la investigación en 
producción hacia metodologías de corte más observacional y ha determinado que las 
principales fuentes de datos se derivaran del análisis de corpus o muestras naturales de 
lenguaje. 

Antes de abordar los procesos cognitivos implicados en la producción del lenguaje, se exa- 
minarán brevemente las características físicas de su materialización última, o habla. 


EL HABLA: MATERIALIZACIÓN DEL LENGUAJE ORAL 

En la producción del habla intervienen de forma coordinada más de un centenar de músculos 
distintos, controlados por nervios diferentes (Meister, Wilson, Deblieck, Wu y lacoboni, 
2007). Hablar es un verdadero prodigio de ingeniería biomecánica que requiere una finísima 
sincronización de muchos movimientos en secuencias complejas. Desde el punto de vista 
motor, es tal vez la conducta más complicada del repertorio humano (Fink, 1986). Por 
ejemplo, la lengua, el órgano más móvil del cuerpo, tiene encerrados en un pequeño espacio 
17 músculos independientes. Ninguna otra parte del cuerpo, ni siquiera la mano, ejecuta de 
forma natural movimientos comparables en rapidez y complejidad a la de los órganos del 
habla. Únicamente la digitación de un pianista experto podría servir de comparación. 
Probablemente, la responsabilidad central de esta extraordinaria orquestación motora recae 
en estructuras neuronales relacionadas con el área de Broca y determinados circuitos 
subcorticales. 


Es posible distinguir tres funciones fisiológicas que 
concurren simultáneamente en la producción del habla: 
a) respiración, que provee la energía mecánica necesaria 
mediante el suministro de aire a presión; b) fonación, 
que genera la fuente del sonido o materia prima acústica 
gracias a las cuerdas vocales, y c) articulación, que 
«moldea« la materia prima a través de los órganos 
articulatorios del tracto o conducto vocal. Hay órganos 
articulatorios fijos, como el paladar duro u óseo, la 
cavidad nasal y los dientes, y órganos móviles, como 
los labios, la lengua, el velo del paladar o paladar 


Paladar 
Alvéolos 


Labios 


vocales 


Glotis 


Figura 10-1. Corte esquemático del tracto vocal, con 
os principales órganos que intervienen en la fonación 


(cuerdas vocales) y articulación (labios, lengua, dien- 
tes, paladar, etc.) de los sonidos del habla. 


blando y la mandíbula (Fig. 10-1). 
Las cuerdas vocales son dos estructuras anatómicas 
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localizadas en la laringe que el individuo puede controlar de forma voluntaria. Cuando se 
respira en silencio, permanecen relajadas y separadas, dejando circular el aire que entra y 
sale de los pulmones. Durante el habla, se tensan determinados músculos que las mantienen 
próximas y, al pasar el aire a presión a su través, vibran con una frecuencia determinada, en 
movimientos rápidos de apertura y cierre (Fig. 10-1). Mientras hablamos, controlamos los 
músculos respiratorios (diafragma y músculos intercostales) para ir dosificando tanto la pre- 
sión como la cantidad de aire que gastamos. Las cuerdas vocales participan en la producción 
de las vocales y las consonantes sonoras (/b/, /d/, /g/, /m/, /V, etc.); no intervienen, sin 
embargo, en las consonantes sordas (/p/, /t/, /k/, /s/, /f/, /q/, etc.). 

Graduando al mismo tiempo la presión del aire y la tensión que comunicamos a las cuerdas 
vocales, podemos modificar la frecuencia de vibración y entonar melodías. Así es como 
generamos, también, la entonación del lenguaje y, con ella, hacemos preguntas, transmitimos 
emociones, expresamos matices, etc., según unas pautas en gran medida universales, pese a 
la diversidad de lenguas. 

El sonido vibratorio por sí solo no es lingúístico, no comunica mensajes ni porta vocales o 
consonantes; ni siquiera suena a humano. Si nuestras cuerdas vocales estuvieran implantadas 
en el cuello y se comunicaran directamente al exterior, sonarían más a una chicharra de 
verano que a una voz humana. Es a su paso por la garganta, más exactamente, a través del 
tubo o tracto vocal, cuando el sonido vibratorio adquiere las resonancias propias de la voz y 
se articula en habla, se modula acústicamente para crear los segmentos fonéticos. 

La producción de habla responde a un modelo físico, ampliamente aceptado por la 
comunidad científica: la denominada teoría de la fuente y el filtro (Fant, 1960). Aunque su 
origen es anterior, el desarrollo matemático se debe al sueco Gunnar Fant. En esencia, el 
modelo considera que el sonido del habla se forma gracias a la conjunción de dos factores: la 
fuente y el filtro. La materia prima acústica se crea en la fuente, o punto donde se genera el 
sonido base que luego habrá que filtrar o modelar. Esta fuente se sitúa en las cuerdas vocales 
si se trata de sonidos sonoros (vocales y consonantes sonoras). En el caso de las consonantes 
sordas, la fuente está en el punto de la boca donde se produce el ruido consonantico; por 
ejemplo, en las fricativas es el paso estrecho donde el aire fricciona con fuerza al pasar a su 
través (entre la lengua y los alvéolos para la /s/; entre los dientes superiores y el labio inferior 
en la /f/; etc.). 

El sonido generado en la fuente se propaga a través del tracto vocal (Fig. 10-1) y, de acuerdo 
con los principios de la física de tubos, es sometido a sus resonancias y sufre un proceso 
complejo de filtrado, donde unas frecuencias se refuerzan y otras se atenúan. Es como si una 
materia prima fuera esculpida acústicamente y recibiera una forma determinada. Son los 
mismos principios físicos que actúan, por ejemplo, en un órgano musical de tubos, 
expresables a través de complejas fórmulas matemáticas. 

Desde el punto de vista acústico, el tracto vocal de un varón medio, medido desde las 
cuerdas vocales hasta los labios, equivale a un tubo recto cilíndrico de 17,5 cm de largo 
(Pickett, 1999) y 5 cm2 de sección. El tracto de la mujer es, en promedio, alrededor de un 
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15% más corto (14,75 cm). El hecho de que el tubo sea recto o curvado, como en el caso 
real, es irrelevante en cuanto a su acústica. Lo importante de verdad es que el tubo 
experimente una constricción o estrechamiento en alguna parte de su recorrido. Según el 
lugar donde se produzca esta constricción, cambia completamente el juego de resonancias 
del tubo, o las frecuencias concretas que se potencian y se atenúan, dando lugar a resultados 
acústicos muy distintos. Precisamente, cuando hablamos creamos estas constricciones 
gracias a nuestros órganos articuladores, sobre todo la lengua. La función de filtro que ejerce 
el tracto vocal a través de sus resonancias es lo que marca la diferencia entre, por ejemplo, 
una /a/ y una /e/. 

En la producción de las consonantes la constricción es más cerrada que en las vocales, hasta 
el extremo de que en las oclusivas se produce, de hecho, una oclusión o cierre completo. 
Según el lugar del tracto vocal donde se produce la constricción principal, se habla de 
consonantes labiales, dentales, palatales, velares, etc.; es lo que se denomina el punto de 
articulación. La forma en que se crean los fonemas constituye el modo de articulación. Por 
ejemplo, los sonidos nasales, como /m/ o /n/, se crean al intervenir un segundo juego de 
resonancias, gracias a la cavidad nasal; esto ocurre porque voluntariamente abrimos el paso 
del aire con nuestro velo del paladar. 

Los sonidos del habla no se disponen como los eslabones de una cadena o las perlas de un 
collar; así es como los representamos en la escritura mediante letras, unas detrás de otras. 
Pero el lenguaje oral no funciona de este modo debido a un fenómeno que es habitual cuando 
hablamos: la coarticulación. Para el lingilista Charles Hockett el habla era más parecida a 
una sucesión de huevos de Pascua de distintos colores espachurrados por un rodillo, de 
manera que los colores se mezclan entre sí y pierden su carácter discreto e individualizado. 
Esto tiene consecuencias en la percepción, de modo que la señal acústica del habla no es una 
ventana transparente a los fonemas; al contrario, al oyente le corresponde la complicada tarea 
de volver a reconstruir y separar los huevos a partir del amasijo. Pero esto lo hace con 
naturalidad y sin esfuerzo. 

A causa de la coarticulación, los rasgos o características de los sonidos vecinos se mezclan y 
se funden entre sí. Cuando articulamos un fonema anticipamos movimientos o gestos 
articulatorios de los fonemas futuros y arrastramos movimientos residuales de los anteriores. 
Hay un solapamiento de movimientos articulatorios, como si articuláramos más de un 
fonema a la vez; de ahí la denominación. A veces la influencia de un fonema se extiende 
hasta 6 unidades más allá. La coarticulación es más patente cuando los órganos que 
intervienen en dos fonemas vecinos son distintos; en estos casos el solapamiento es más 
fácil. Por ejemplo, si pronunciamos la sílaba /su/, el abocinamiento de los labios 
característico de la /u/ se anticipa y se produce ya mientras articulamos la /s/, «tiñéndola» de 
/u/; escuchando sólo la /s/ «adivinamos» prácticamente sin error que la vocal siguiente es la 
/u/. Este hecho, aparentemente anodino, es fundamental para que el habla se pueda 
descodificar de forma natural a una velocidad muy alta, lo que no sucede con cualquier otro 
código sonoro (p. ej., el Morse). 
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Una vez examinadas las características físicas del habla humana, o resultado último de la 
producción lingiística, pasaremos revista a las principales fuentes de datos con que la 
psicología del lenguaje cuenta para el estudio de los procesos mentales involucrados en esa 
producción oral. 


FUENTES DE DATOS 
La investigación sobre la producción oral del lenguaje discurre entre dos aproximaciones 
básicas (Levelt, 1999): una, de más larga tradición, se basa en la observación y el registro del 
habla espontánea de las personas con objeto de analizar determinados patrones, como las 
pausas y características temporales del habla, los errores espontáneos o el interesante 
fenómeno de la «punta de la lengua», y otra, de corte experimental, se basa sobre todo en los 
tiempos de reacción en el nombrado de objetos o dibujos. 
A ellas se unen las evidencias de carácter neurológico, tanto de pacientes con lesiones 
cerebrales causantes de trastornos del lenguaje -afasias y anomias-, como, más 
recientemente, los registros electrofisiológicos y de neuroimagen en personas con el cerebro 
intacto. 

+ Características temporales del habla: pausas y vacilaciones 
El análisis de las características temporales del habla, junto con el estudio de las pausas e 
interrupciones que comete el hablante, como repeticiones, falsos comienzos y otros tipos de 
vacilaciones o titubeos, ha constituido una fuente útil de datos para inferir algunos de los 
procesos en curso durante la producción del lenguaje. 
Teniendo en cuenta que el habla se puede caracterizar como una sucesión de períodos de 
fonación y períodos de silencio o pausas, estas últimas se han considerado como indicadores 
de actividad cognitiva comprometida en los procesos de producción. Generalmente a las 
pausas se les reconoce tres funciones muy distintas en la producción verbal: a) fisiológica, 
para permitir la inspiración de aire; b) cognitiva, en relación con los procesos de 
planificación del lenguaje, y c) comunicativa, facilitando la comprensión del oyente al 
ejercer un papel demarcativo de la estructura lingúística. Lógicamente, desde el punto de 
vista psicolingiiístico, el interés se centra en la segunda función 
La dificultad reside en que no es posible establecer una relación biunívoca entre funciones y 
pausas; no cabe hablar de pausas meramente comunicativas o respiratorias frente a pausas de 
naturaleza cognitiva. Dos o más funciones pueden converger simultáneamente en una misma 
interrupción del habla y nada impide, por ejemplo, que el hablante, dado el control que tiene 
sobre el habla, modifique su conducta respiratoria haciendo coincidir las interrupciones 
necesarias para inspirar con las impuestas por los procesos de planificación del discurso. Sin 
embargo, se sabe que las pausas no se distribuyen al azar ni se ajustan únicamente a los 
requisitos fisiológicos, sino que tienden a surgir entre las grandes unidades lingúísticas 
-Cláusulas y sintagmas- y, cuando son internas, aparecen en los puntos de la cadena hablada 
con mayor incertidumbre estadística, es decir, en las transiciones menos predecibles. 
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También se distingue entre pausas vacías —silencio— y pausas llenas -ocupadas por sonidos 
como «aah», «eeh»- y se estudia si ambas tienen una significación funcional distinta. 
Los análisis han puesto de manifiesto una estructura cíclica del habla espontánea, en la que 
períodos titubeantes, con una alta proporción de pausas y vacilaciones, son seguidos de 
períodos fluidos con un predominio de los tiempos de fonación (Beattie, 1983; Fig. 10-2). 
De acuerdo con esta estructura cíclica, Goldman-Eisler 
(1968) propuso una concepción del habla como una 
sucesión alterna de períodos de planificación, en los que 

mida la cadena hablada se suspende porque los recursos 
cognitivos y atencionales se dedican a los procesos más 
centrales de planificación, y períodos de ejecución, en los 
TT a qUe se realiza de modo más automatizado lo planificado 

Tiempo de habla (s) anteriormente. Sin embargo, no siempre es fácil 
Figura 10-2. Alternancia de fases fluidas y no fluidas identificar estos ciclos, y algunos autores han 
eran un mendlogo. Adaptado de Beatle Considerado esta hipotética estructura cíclica como un 
mero artefacto de naturaleza aleatoria. 
En un nivel más local del discurso, la distribución de las pausas constituye un claro indicador 
de operaciones de selección léxica, y éstas tienden a colocarse ante elementos léxicos de baja 
frecuencia de uso, tanto en inglés como en castellano y en otros idiomas (González, Cervera 
y Miralles, 1996). 
El análisis de las auto correcciones que los propios hablantes realizan mientras hablan es, 
asimismo, una interesante fuente de datos, tanto en situaciones espontáneas como 
experimentales. En el primer caso, su estudio se incluye dentro del examen de las 
vacilaciones, pausas y otras disfluencias que acabamos de reseñar. Experimentalmente se 
consiguen inducir a través de una metodología muy ingeniosa introducida por Wijk y 
Kempen (1987). Dichos autores presentaban a los sujetos escenas dibujadas que debían ser 
descritas verbalmente; en el transcurso de la descripción, los dibujos eran inadvertidamente 
sustituidos por otros similares que presentaban algunas modificaciones respecto a los 
originales, lo que provocaba autocorrecciones en el participante. 

+ Errores del habla 

Una de las fuentes más valiosas en el estudio de la producción oral son los lapsus linguae 
(slips of the tongue, en la literatura internacional) o errores que se producen durante el habla 
normal que no se corresponden con aquello que el hablante pretende decir. En inglés se 
denominan también spoonerims en recuerdo del reverendo de Oxford William A. Spooner 
(1844-1930), célebre por sus frecuentes equivocaciones al hablar, de quien se conservan 
numerosos ejemplos: "Work is the curse of the drinking classes' (el trabajo es la maldición de 
las clases bebedoras) en lugar de: 'Drink is the curse of the working classes' (la bebida es la 
maldición de las clases trabajadoras). 
El interés por el estudio de los errores del habla surgió ya a finales del siglo XIX de la mano 
de Meringer y Mayer (1895) y, poco después, Freud le dedicó un capítulo en su 


Fase fluida 


Fase fluida 


Tiempo de pausa (s) 
00 
o 


Fase no Cic lo 
fluida.” 
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Psicopatología de la vida cotidiana (1901). No obstante, el verdadero impulso lo recibió del 
trabajo de Victoria Fromkin, quien en 1973 publicó un libro monográfico sobre el tema, 
Speech errors as linguistic evidence, donde recopila las publicaciones dispersas habidas 
durante las décadas de 1950 y 1960. A partir de entonces, los trabajos se sucedieron sin 
cesar, hasta el punto de que ha llegado a ser una de las áreas de investigación más prolíficas 
sobre la producción del lenguaje. 
Los errores del habla suponen una de las principales fuentes de observación para la 
elaboración de los modelos teóricos. Los autores parten del supuesto de que son el resultado 
de un mal funcionamiento momentáneo de los mismos procesos responsables del lenguaje 
libre de errores y pueden desvelar algunos detalles de los mecanismos que normalmente 
pasan inadvertidos; se trata de la misma lógica que subyace, por ejemplo, en el análisis de las 
ilusiones visuales como medio de estudio de la percepción visual. 
Prueba del interés suscitado por los lapsus linguae es la recopilación de corpus de errores en 
diversos idiomas. En España contamos con el corpus recogido por Susana del Viso (1990, 
2002), que abarca un total de 4.410 errores. Los errores pueden afectar a distintas unidades; 
veamos varios ejemplos tomados de Del Viso (2002): 

Fonema: en casa de herrero cuchk/?o [cuchillo] de palo. 

Secuencia de fonemas: yo soy una chica putfa y cara [pura y casta]. 

Raíces: ¿nos fumamos un medio a. negras? [un negro a medias]. 

Sufijos: Los bebeses inglés [los bebés ingleses]. 

Palabras: Muestran un carácter de lenguaje telegráfico [lenguaje de carácter]. 

Supraléxica: Se me ponen los pelos de gallina [los pelos de punta/la piel de gallina]. 


Recuadro 10-2. Tipos de errores del habla según su naturaleza 


e Errores de movimiento o contextuales: 
- Anticipaciones: días de nuvia [lluvia] y nieve, lleva las manos [llaves] en las manos. 
- Perseveraciones: la canción de la cuna [luna], si abres la boca y metes la boca [pata]. 
- Desplazamientos: betún de Judera y cea (betún de Judea y cera); ellos siempren viene [ellos 
siempre vienen]. 
Intercambios: pásame el gallete de paquetas [pásame el paquete de galletas]; hay una 
médica de huelgos [hay una huelga de médicos]. 
- Errores incompletos: me acaba de venir una cabeza [me acaba de venir una cosa a la ca- 
beza] 


e Errores no contextuales: 
- Sustituciones: ¡no voy a volver a zumar [fumar] más! 
- Fusiones: ¡ay, qué baldejos más guapos! [baldosas + azulejos]; esto está lleno de altablos 
[altares + retablos]. 
- Omisiones: contra las topas croatas [tropas]. 
- Adiciones: sí, pero ellas son de claustura [clausura]. 


+ Otros errores: en acento y variables suprasegmentales: que se escucha la exTRANjera (que se 
escucha la extranJEra). 


De acuerdo con Del Viso (1990, 2002), según su naturaleza, los errores pueden clasificarse 
en (Recuadro 10-2): errores de movimiento o contextúales, en los que existe un 
desplazamiento o intercambio entre diferentes elementos de la cadena hablada; errores no 
contextúales, como las simples sustituciones, omisiones, adiciones o fusiones de elementos, 
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y, por último, otros errores localizados en el acento y en variables suprasegmentales, como la 
entonación. Por otra parte, este esquema de clasificación viene siendo básicamente el mismo 
desde los tiempos de Meringer y Mayer (1895). 
Hay que precisar, como puntualiza Del Viso (2002), que los errores son muy diversos, pero 
en ningún modo aleatorios o arbitrarios, sino que constituyen un fenómeno sistemático y 
sometido a reglas. Los hablantes podemos equivocarnos de múltiples formas, pero no de 
cualquier forma. El cansancio o el estrés pueden incrementar la cantidad de errores, pero no 
altera su cualidad o características básicas. 
Los errores del habla se encuentran sujetos a determinadas restricciones de carácter 
gramatical. Afectan a sintagmas, palabras, morfemas o fonemas, pero, por ejemplo, 
raramente afectan a sílabas. El elemento erróneo y el elemento pretendido casi siempre 
pertenecen a la misma clase gramatical. Cuando hay una sustitución de una palabra por otra 
se pone generalmente de manifiesto una relación entre ambas, bien fonológica, bien 
semántica, o ambas a la vez, según los casos. Por último, hay restricciones en cuanto a la 
buena forma gramatical, de modo que normalmente los errores dan lugar a secuencias 
«legales» O aceptadas en la gramática de cada lengua, ocasionando modificaciones en los 
elementos circundantes para mantener la concordancia de género y número o verbal. 
Los errores de movimiento —en particular los desplazamientos e intercambios- son 
especialmente informativos sobre los procesos mentales de secuenciación y ordenación que 
ocurren mientras planificamos el lenguaje en tiempo real, ya que son una interacción entre 
dos elementos que, de algún modo, deben estar presentes simultáneamente en la 
representación mental de lo que se va a decir (Del Viso, 2002). La distancia que media entre 
ellos puede dar una idea del tamaño o amplitud de las unidades de planificación en un 
momento dado, y éste ha sido un aspecto profusamente estudiado (Garrett, 1984). 
Los errores del habla no sólo se han estudiado a partir de corpus obtenidos del habla 
espontánea; Baars, Motley y McKay (1975) los provocaron experimentalmente a través de 
una técnica que luego se ha aplicado en muchas ocasiones. Consiste en dar a leer a los 
participantes pares de palabras que han sido seleccionadas para incrementar la probabilidad 
de error, cuya tasa alcanza un 10-15 % de los estímulos. Con el mismo fin, Shattuck- 
Hufnagel (1993) ha empleado eficazmente una técnica basada en los trabalenguas. 

+ Estados de «punta de la lengua» 
Todos hemos sufrido alguna vez la sensación de tener una palabra en la «punta de la lengua» 
que no logramos localizar en nuestra memoria, pero tenemos la certeza de que la sabemos y 
parece que está a punto de surgir en cualquier momento. Este fenómeno (TOT, tip ofthe 
tongue en la literatura internacional) ofrece una especial oportunidad para explorar los 
procesos de producción de las palabras porque implica precisamente un fallo selectivo en la 
recuperación de su forma. 
El fenómeno de la «punta de la lengua» se define como el estado subjetivo que a veces 
experimenta un hablante cuando está seguro de que conoce una palabra y, sin embargo, es 
incapaz temporalmente de obtenerla y pronunciarla, al tiempo que su recuerdo le parece 
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inminente. En esa experiencia tan cotidiana, el individuo «sabe» que la información fonética 
de la palabra permanece almacenada en su memoria y que de un momento a otro estará 
disponible. 
El fenómeno llamó la atención de los psicólogos hace más de un siglo, especialmente de 
Willian James (1893), a quien debemos una de las descripciones más intuitivas, citada con 
frecuencia (Theprincipies ofpsychology, vol I p. 251): 
El estado de nuestra conciencia es peculiar. Hay un hueco, pero no es meramente un 
hueco. Se trata de un vacío intensamente activo. Una especie de espectro del nombre 
que nos hace señas en una dirección determinada, produciéndonos por momentos un 
estremecimiento por la sensación de su proximidad y dejándonos, después, abatidos 
sin el ansiado término. Si se nos proponen nombres equivocados, este vacío actúa 
inmediatamente negándolos, porque no se acoplan a ese molde. Y el hueco de una 
palabra no es igual al hueco de otra. 
Durante un fenómeno de «punta de la lengua» el hablante suele disponer de información 
parcial sobre la forma de la palabra -su longitud aproximada, algunos fonemas o fragmentos, 
según los casos- y siempre cuenta con la información semántica: puede responder a 
preguntas sobre su significado. Parece que el fenómeno de «punta de la lengua» corresponde 
a una interrupción en un estado intermedio de la activación léxica, una especie de foto fija de 
algo que normalmente sucede de forma rápida. Pone de manifiesto que la recuperación de las 
unidades léxicas desde nuestro diccionario mental no se realiza a través de un único paso, 
sino que, al menos, existen dos tipos de representaciones cognitivas relativamente 
diferenciadas: una correspondiente a la información fonológica de la palabra y otra a su 
contenido semántico. 


Esto concuerda con el esquema de Levelt (1989) sobre 
Lemma la estructura interna de las palabras. De acuerdo con su 
planteamiento, habría claramente dos elementos (Fig. 


Fenómeno 


O la 10-4): el lemma, que incorporaría información 
Morfología | Fonología Pa A sf e, 

semántica sobre el significado de la palabra y también 
información sintáctica, y el lexema o forma de la 


Lexema 


o el aiiaeteiood palabra, que abarcaría información morfológica y 

según Levelt (1989). fonológica (los sonidos que la componen). 
Habitualmente, toda la información se activa y está disponible en la mente del hablante, pero 
en raras ocasiones, como en el fenómeno de la «punta de la lengua», el paso del lemma a la 
forma podría quedar interrumpido y en ese caso sólo estaría disponible la información 
contenida en el lemma. 
Aquí la pregunta es si, además del significado, durante un fenómeno de la «punta de la 
lengua» también está disponible la información sintáctica. Un banco de pruebas magnífico es 
el género gramatical de los nombres en algunas lenguas como el italiano o el español, 
ausente en inglés. Por ejemplo, «libro» o «cáliz» son masculinos, sin que tales objetos 
posean ningún atributo sexual masculino, mientras que «silla» o «miel« son femeninos 
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aunque tampoco tienen atributos sexuales femeninos. Es decir, en dichas lenguas, el género 
de los objetos inanimados -no así el de los animales o personas- constituye una información 
genuinamente sintáctica, desligada de cualquier información semántica. Una persona que 
sufre un fenómeno de la «punta de la lengua» ¿puede indicar el género gramatical de la 
palabra buscada? La respuesta es claramente sí; aunque no es capaz de pronunciarla, sí puede 
decir si se trata de «un...» o de «una...» en una proporción muy alta de los casos. Gabriela 
Vigliocco et al. comprobaron esto experimentalmente para el italiano (Vigliocco, Antonini y 
Garrett, 1997) y también se pudo observar en el castellano (Vigliocco, Vinson y González, 
1998). Resultados semejantes se han obtenido con otra información sintáctica como el rasgo 
contable/no-contable del inglés (Vigliocco, Vinson, Martin y Garrett, 1999). 
¿Cómo se estudian los fenómenos de la «punta de la lengua» experimentalmente? Se inducen 
en el laboratorio a través de una metodología que inauguraron Brown y McNeill (1966). 
Estos autores presentaron definiciones de palabras relativamente raras (sextante, ámbar, 
cloaca, etc.) a los participantes, y la tarea de éstos consistía en escribirlas. Por ejemplo, para 
sextante la definición era: 

Instrumento de navegación utilizado para medir distancias angulares, como la altitud 

relativa del sol, la luna y las estrellas sobre el nivel del mar. 
En ocasiones, los participantes caían en situaciones de fenómeno de la «punta de la lengua» 
y en esas circunstancias se les pedía por escrito que hicieran conjeturas acerca de 
características parciales de la palabra en cuestión. Los resultaron demostraron que, durante 
un estado de «punta de la lengua», el hablante posee importante información acerca de la 
palabra que no consigue recuperar, sobre todo la letra inicial y final, el número de sílabas y 
la posición del acento (para revisiones, véase Brown, 1991, 2012). Por ejemplo, es posible 
que el hablante sea incapaz de recordar la palabra «sextante», pero sabe que empieza por «s» 
y acaba en «e» y que seguramente tiene tres sílabas (Brown y McNeill, 1966). La mayoría de 
los estudios experimentales han seguido esta metodología, si bien en algunos de ellos se han 
empleado otras clases de estímulos, como caras de personajes famosos, nombres de animales 
imaginarios o listas de pares asociados previamente aprendidos. 
Además, el fenómeno de la «punta de la lengua» ha sido examinado en sus condiciones 
naturales a través de la cumplimentación de un diario, que el participante lleva consigo 
durante un período de tiempo, o mediante información retrospectiva respondiendo a un 
cuestionario. Las diferencias individuales en cuanto a la frecuencia de dichos fenómenos son 
muy importantes; los estudios hablan de uno semanal como promedio. La forma en que se 
resuelven -es decir, se encuentra la palabra buscada- también es variable, ya que puede 
ocurrir a los pocos minutos o muchas horas después. Puede ocurrir de manera espontánea o 
resolverse mediante la búsqueda activa del individuo, consultando alguna fuente o a otras 
personas. A veces, los hablantes adoptan ciertas estrategias, como repetir muchas veces una 
palabra relacionada. 
Los fenómenos de la «punta de la lengua» se producen sobre todo ante palabras poco 
frecuentes del idioma o nombres propios de lugares, personas conocidas, etc., y se hacen más 
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habituales con el envejecimiento (véase en castellano Juncos-Rabadán, Facal, Alvarez y 
Rodríguez, 2006). Por otra parte, hay que recordar que el fenómeno de la «punta de la 
lengua» es un estado transitorio en los hablantes sanos, pero existen situaciones clínicas 
originadas por lesiones cerebrales en las que fallos semejantes se dan con asiduidad, como es 
el caso de las anomias. 
Cuando un hablante experimenta un fenómeno de la «punta de la lengua» e intenta recuperar 
la palabra que lo causa, es probable que se activen en su mente otras palabras, entre las 
cuales a veces destaca una de forma recurrente a modo de un intruso que se interpone en el 
proceso de búsqueda, a pesar de que se reconoce como erróneo. Por ejemplo, un participante 
refería una ocasión en la que deseaba expresar «mezquita», pero en su mente se cruzaba la 
palabra «ermita», de fonética y significado similares. Otro deseaba decir «guadaña» y se 
interponía «cigiieña», de fonética próxima. 
En 1996, González, uno de los autores, llevó a término el primer trabajo sobre fenómenos de 
la «punta de la lengua» en castellano, con estudiantes de la Universidad Jaume 1 de 
Castellón. Dicho trabajo se componía de dos estudios: uno basado en un cuestionario y otro 
experimental. En este último se utilizó la metodología clásica de las definiciones; he aquí 
algunas de ellas junto a la palabra clave y el número de fenómenos de la «punta de la 
lengua» que generaron en una muestra de 102 participantes: 

Antepasado prehistórico del elefante actual [mamut]: 15. 

Templo musulmán [mezquita]: 13. 

Animal o planta que vive a costa de otra especie [parásito]: 12. 

Jinete, en femenino [amazona]: 11. 

Animal mitológico con arco y flechas formado por la mitad hombre y la mitad caballo 

[centauro]: 9. 

Membrana que rodea a los pulmones [pleura]: 9. 

Personajes muy pequeños con los que se encontró Gulliver en su viaje [liliputienses]: 

9: 

Cubierta rígida de la tortuga y otros animales [caparazón]: 5. 
Los resultados corroboraron lo que ya se había observado para el inglés: durante un estado 
de «punta de la lengua» muchos participantes disponen de información parcial sobre la 
palabra que no logran decir, sobre todo la primera y última letra y su longitud aproximada en 
número de sílabas. El estudio de cuestionario recogía información retrospectiva sobre 
fenómenos de la «punta de la lengua» reales acaecidos en situaciones naturales, así como las 
circunstancias que los rodearon (información disponible sobre la palabra buscada, presencia 
de palabras intrusas, cuándo y cómo se resolvieron, estrategias empleadas por los hablantes, 
etc.). En la tabla 10-1 se presentan algunos ejemplos. 
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Tabla 10-1. Ejemplos de estados de «punta de la lengua» experimentados en situaciones 


naturales, según informe retrospectivo de los propios hablantes” 


pas Información Palabra Estrategia 
disponible . empleada Resolución 
(causante intrusa 
en el estado PL por el hablante 
del PL) 
Manopla La primera letra es M Guante Repetir mentalmente Surgió en escasos minutos 
Tiene 3 sílabas prendas de vestir 
Pomo La primera letraesP. Cerradura Repetir mentalmente Surgió en escasos minutos 
Tiene 2 sílabas palabras relacionadas 
semánticamente 
Filatelia Sólo su significado - Recordar hechos Surgió espontáneamente 
relacionados horas después 
con los sellos 
Eloy Empieza por E Elias Repetir nombres propios Surgió minutos después, 
Ernesto parecidos durante la búsqueda activa 
Bazoka La palabra tiene 3 Trabuco Consultar con otra Otra persona dijo el nombre 
sílabas persona 
Tiene una C y dos A 
Guadaña Conoce el objeto Cigualla Repasar palabras Surgió espontáneamente 
Cigúeña similares fonéticamente unas horas después, cuando 
(como araña, cigijeña, ya no pensaba en ello 
guardar, etc.) 
Pupila Tiene una | y una U Pluvia Repetir mentalmente Surgió en segundos, durante 
palabras con | y U la búsqueda activa 
Metadona Sólo su significado Acetona Repetir muchas veces Surgió en segundos, durante 
la palabra acetona la búsqueda activa 
Incesto Sólo su significado - Recordar hechos Surgió espontáneamente 
relacionados una hora después 
con el significado 
Silvia Conoce a la persona Isabel Pensar en hechos Otra persona dijo el nombre 
relacionados 
con esa persona 
Ludópata Acaba en PATA Ápata Repetir mentalmente Otra persona dijo el nombre 
palabras y seudopalabras 
acabadas en pata 
Agustina Nombre propio de Antonia Pensar en la plaza Surgió a los pocos minutos, 
persona conocida y en nombres de calles durante la búsqueda activa 
que coincide con 
el nombre de una 
plaza de la ciudad 
Mezquita Córdoba tiene una Ermita Repetir mentalmente Otra persona dijo el nombre 
que la hace famosa la palabra Córdoba horas después 
Koala Animal simpático Canguro Recordar conductas Surgió en minutos, durante 
que come eucalipto Rana del animal la repetición de la palabra 


Repetir mentalmente eucalipto 
la palabra eucalipto 


Continúa 


Tabla 10-1. Ejemplos de estados de «punta de la lengua» experimentados en situaciones 


naturales, según informe retrospectivo de los propios hablantes (cont.) 


Palabra Sr - 
Información Estrategia 
due disponible rada empleada Resolución 
en el estado PL por el hablante 
del PL) 
Yakuzzi Palabra japonesa con Suzuki Repetir suzuki y otras Lo dijo otra persona al cabo 
K y acabada en | palabras japonesas de minutos 
Yeltsin Presidente de la Helsinki Pensar en noticias sobre Surgió otro día, al leer 
Federación Rusa el personaje el periódico 
Neceser Empieza por NE - Consultar otra persona La madre del sujeto dijo 
Acaba en R el nombre 
Arabesco Nombre de una Baresco Repetir mentalmente Surgió espontáneamente 
discoteca palabras y horas después 
Dibujos árabes seudopalabras similares 


Tomado de González, 1996. 
2 En todos los casos el hablante conocía el significado de la palabra causante del estado de «punta de la lengua» (PL). 
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+ Estudios experimentales cronométricos 

Como ya se ha mencionado, las fuentes de datos anteriores, de naturaleza eminentemente 
observacional, son también susceptibles de ser abordadas experimentalmente. En este 
apartado se hará referencia en particular a los métodos cronométricos basados en los tiempos 
de reacción en experimentos de nombrado de objetos, generalmente representados mediante 
dibujos (para una revisión, véase Levelt, 1999). Ya en 1885, Cattell descubrió que nombrar 
una lista de 100 objetos dibujados con líneas requería el doble de tiempo que nombrar (leer) 
sus correspondientes nombres impresos. Trabajos posteriores confirmarían esta observación 
inicial, cuya explicación más aceptada es que hay una ruta de acceso directo entre la palabra 
escrita y el código fonológico, mientras que el dibujo activa primero la representación 
conceptual del objeto y sólo después su código fonológico, lo que supone un paso extra. 

En los estudios actuales se utilizan bases de dibujos proporcionadas a la comunidad 
científica para desarrollar normas de referencia sobre los tiempos de reacción al ser 
nombrados. 


Una de las primeras —y la más característica- ha sido la 
A UA US | base de 260 dibujos de Snodgrass y Vanderwart (1980) 
AS O Pe : => (Fig. 10-5), de la que se disponen valores para su 
16 117 118 119 del nombrado en castellano (Cuetos et al., 1999; Sanfeliu y 
E Ny “DD E, DY Fernández, 1996). Su empleo ha sido y es profuso, 

E Ao publicándose valores normativos en diferentes lenguas; 
49260 me sirvan de ejemplos recientes Tsaparina, Bonin y Méot 
(2011) para el ruso o Bakhtiar, Nilipour y Weekes 

(2013) para el persa, ambos a partir de una versión coloreada de los dibujos. 
Un efecto pronto observado en el nombrado de dibujos/objetos es el de la frecuencia léxica 
del nombre; los dibujos cuyos nombres son menos frecuentes en el idioma requieren más 
tiempo para ser nombrados (Oldfield y Wingfield, 1965). (Para un estudio del efecto de la 
frecuencia en castellano y en francés véase el artículo de Cuetos, Bonin, Alameda y 
Caramazza, 2010.) 
En 1935, John Stroop introdujo un nuevo paradigma experimental muy fructífero (hoy 
conocido como tarea de Stroop), en el que los estímulos -nombres de colores- estaban 
coloreados de diferentes colores y los participantes tenían que nombrar rápidamente el color 
de la tinta, intentando ignorar el significado de la palabra. Se producía una interferencia, un 
notable enlentecimiento en la respuesta si el color de la tinta era distinto del color indicado 
por la palabra (p. ej., la palabra «rojo» escrita en tinta verde, y la respuesta correcta es 
verde). Sin embargo, el autor no halló el efecto recíproco si la tarea consistía en nombrar — 
leer— la palabra, en lugar del color de la tinta. 

Una variante de la tarea de Stroop es la tarea de interferencia palabra-dibujo, muy utilizada 

en la experimentación sobre la producción de palabras. Consiste en la presentación de un 

dibujo y sobre él una palabra escrita que no corresponde al dibujo pero se halla relacionado 
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semánticamente con él (p. ej., el dibujo de un elefante junto a la palabra «jirafa», y la 
respuesta debe ser elefante; Fig. 10-6). 

De nuevo, la interferencia aparece en el nombrado del 
dibujo, pero no cuando la tarea consiste en leer la 
palabra. Se trata, por lo tanto, de una inhibición 
semántica de la palabra distractora hacia el nombrado 
del dibujo. Sin embargo, cuando la palabra escogida no 
tiene relación semántica, sino fonológica (rima con el 
nombre del dibujo, por ejemplo «cantante», para el 
dibujo del elefante), surge un efecto de facilitación 
fonológica y los tiempos de reacción se acortan. 

Los experimentos con la tarea de interferencia palabra-dibujo son especialmente útiles para 


Figura 10-6. Ejemplo de estímulo utilizado en los ex- 
perimentos de interferencia palabra-dibujo. 


intentar desentrañar los subprocesos que intervienen en la producción de las palabras y, sobre 
todo, el curso temporal de esos procesos. Glaser y Dingelhoff (1984) fueron los primeros en 
estudiar el curso temporal de la producción oral variando sistemáticamente los tiempos entre 
la presentación de la palabra y la presentación del dibujo. Técnicamente, el tiempo que 
separa dos estímulos se conoce como asincronía entre los inicios de los estímulos (stimulus 
onset-asynchronies, SOA). 


En la figura 10-7 se muestra una parte de los resultados 
del primer experimento de Glaser y Diingelhoff (1984); 
sn cd NN en cada ensayo se presentaba un dibujo y una palabra, y 


200 Nombrado de dibujo 


100 la tarea consistía en nombrar el dibujo ignorando la 
palabra. Los autores jugaron sistemáticamente con los 


p Si SOA oO asincronías entre palabra-dibujo, como se 

EITC YUI A y A PUT AAA A 

-400-300-200-100 O 100 200 300 400 
Asincronía palabra-dibujo (ms) 


Inhibición (ms) 


50 


observa en el eje horizontal, de modo que los valores 
negativos significan que la palabra va antes que el 
(1988) Interferencia en el nombrado de dibujosacas.  libujo y los positivos que va después, mientras que el 
an semánticamente (véase Coro es, lógicamente, la presentación simultánea de 
ambos estímulos. Cuando la palabra (p. ej., «pie») 
pertenecía a la misma categoría que el dibujo (mano) se producía una interferencia semántica 
que retrasaba el nombrado del dibujo. El eje vertical muestra la inhibición en milisegundos o 
tiempo de reacción añadido a causa de la palabra; este retraso se ha calculado respecto a una 
condición neutra en la que el dibujo estaba acompañado de un estímulo sin sentido. Es obvio 
que la activación del significado de la palabra interfiere en el significado del dibujo en un 
intervalo que abarca unos 300 ms antes y después de la presentación del dibujo, alcanzando 
un máximo de interferencia entre O y 100 ms tras la aparición del dibujo. Estos datos son 
coincidentes con lo observado para el efecto Stroop, de naturaleza claramente semántica. 
Resultados como éstos han servido también para alimentar el modelo computacional 
WEAVER de Roelofs (1997), un programa informático que intenta simular los procesos 
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mentales de producción de palabras y que, a su vez, puede ser fuente de nuevas hipótesis que 
deben ser comprobadas de forma empírica en los seres humanos. 
Una última innovación experimental en la tarea de nombrado de dibujos se debe a Schriefers, 
Meyer y Levelt (1990), quienes introducen la palabra distractora de forma auditiva, en lugar 
de escrita. En general, lo que se obtiene en los trabajos de interferencia palabra-dibujo es una 
inhibición semántica temprana cuando la palabra semánticamente relacionada se presenta al 
mismo tiempo que el dibujo o un poco antes o después, y una facilitación fonológica cuando 
la palabra fonológicamente relacionada (p. ej., que rima) se presenta un tiempo después, lo 
cual indica que, cuando producimos una palabra, la activación semántica ocurre unos 100- 
150 ms antes que la fonológica (Cuetos, 2003). 

+ Evidencia neurológica 
Como se ha señalado, las alteraciones transitorias del habla en individuos normales —pausas 
y titubeos, errores o lapsus linguae, estados de la «punta de la lengua»- constituyen fallos 
reveladores que arrojan luz sobre algunos subprocesos involucrados en la producción del 
lenguaje. Ahora bien, el estudio de los patrones estables de alteración a causa de una lesión 
cerebral —principalmente afasias y anomias— tiene también un gran valor para el mismo 
fin. 
El análisis sistemático de las afasias, las anomias y otras alteraciones patológicas del 
lenguaje constituye una fuente importante de información sobre el funcionamiento de los 
mecanismos lingiíísticos normales y representa el campo de la neuropsicología cognitiva. Se 
parte de dos supuestos: la especificidad y la transparencia. El primer supuesto asume que es 
posible encontrar patrones de preservación y deterioro del lenguaje altamente selectivos y 
específicos, dependientes de ciertos subprocesos pero no de otros, y también patrones 
complementarios o dobles disociaciones, como se verá con detalle en el capítulo 12. El 
segundo supuesto considera que el resultado de una lesión es un patrón de conducta que no 
se aprende ex novo en su totalidad, sino que refleja la organización de un sistema sano 
preexistente, que ahora, con la lesión, debe funcionar con uno de sus componentes alterados; 
esto sería lo que se conoce como un supuesto de transparencia. 
Además del análisis de las consecuencias del daño cerebral, gracias a las técnicas avanzadas 
de neuroimagen y electrofisiología cerebral en las últimas décadas se ha asistido a una 
verdadera explosión de estudios sobre la función cerebral en personas sanas (Recuadro 10- 
3). 
El esquema básico de investigación es registrar la actividad cerebral mientras el participante 
lleva a cabo una tarea de producción del lenguaje, con el fin de identificar las áreas 
cerebrales más directamente involucradas (Rodríguez-Ferreiro y Cuetos, 2012). Las tareas 
habituales durante, por ejemplo, el registro de potenciales evocados o de imágenes por 
resonancia magnética funcional son la denominación de dibujos, la generación (oral o 
encubierta) de palabras o la lectura de palabras y seudopalabras y, lo que es más importante, 
la comparación entre dos tareas distintas para aislar el subproceso que se quiere estudiar. 


booksmedicos.org 


16 


Psicología del Lenguaje — TEMA 10 


Recuadro 10-3. El cerebro parlante 


Pese a los avances recientes, Hagoort y Levelt (Science, 2009, p. 372) reconocen que «desde el 
descubrimiento en 1885 por el médico francés Pierre Paul Broca del papel de la corteza frontal 
inferior izquierda en el habla, se han hecho relativamente pocos progresos en la comprensión de 
la infraestructura neural que sostiene la producción del habla». La razón estriba en que, al ser el 
lenguaje especificamente humano, no disponemos de un modelo animal como en otras funciones 
cognitivas (percepción, memoria, tareas ejecutivas) y, por lo tanto, no caben las técnicas invasi- 
vas —registros neuronales múltiples- aplicables en animales no humanos. 


Una excepción ha sido el estudio de Sahin, Pinker, Cash, Schomer y Halgren (2009), publicado 
en Science. Los autores tuvieron la rara oportunidad de registrar la actividad neuronal de tres 
pacientes con epilepsia mediante la implantación de múltiples electrodos profundos en el área 
de Broca y zonas vecinas de la corteza temporal. Esta técnica de electrofisiología intracraneal, 
que formaba parte de la preparación prequirúrgica, obviamente no se habría aplicado sólo para 
la investigación por razones éticas. 


La electrofisiología intracraneal permite simultáneamente una extraordinaria precisión espa- 
ciotemporal aún inalcanzable por los procedimientos no invasivos habituales. Se obtuvieron regis- 
tros de los participantes durante: a) una tarea de lectura silenciosa de palabras y b) una tarea que 
requería flexionar las palabras (se presentaba primero el contexto oracional, p. ej. «Ayer ellos...», 
a continuación la palabra «pasear», y los sujetos 
debían flexionarla en silencio, «pasearonn). De esta 

ARA segunda tarea había dos versiones (en inglés), sin 
Selección léxica <> 200 ms | cambio fonológico ('Every day, they_', 'walk') y con 
cambio fonológico ('Yesterday, they_', 'walked'). 


Flexión gramatical <> 320 ms 4 


; po Al comparar los registros, descubrieron que el 
BA Codificación fonológica <> 450 ms [Y área de Broca participaba en todos los subprocesos 
: A a en una secuencia de tiempos distintos (Fig. 10-8). 
Es decir, la exploración cortical en una escala de 
gran detalle revela que la contribución del área 
de Broca podría variar con el tiempo como conse- 
cuencia de diferentes redes dinámicas que se acti- 
varían en momentos distintos. 


Figura 10-8. Secuencia temporal de subpro- Establecer si, además, hay una segregación es- 
cesos en los que participa el área de Broca.  pacial a nivel de microcircuitos dentro de la misma 
Adaptada de Hagoort y Levelt (2009). área es algo que queda pendiente para el futuro. 


NIVELES DE PROCESAMIENTO EN LA PRODUCCIÓN DEL LENGUAJE 

Cuando las personas hablan en la lengua que dominan, ponen en marcha un mecanismo 
mental complejo que parte de una intención inicial de comunicar algo y acaba en la 
articulación de una emisión verbal. La producción del lenguaje se diferencia así de la 
comprensión en la direccionalidad de los procesos; en esta última se parte de un estímulo 
externo y termina en la construcción del significado. 

Hace más de un siglo, William James ofreció una interesante descripción subjetiva de la 
producción del lenguaje que implicaba dos partes: a) un proceso de pensamiento, que es 
holístico y global, y b) un proceso de habla que es serial y comporta un ensamblaje lineal de 
sonidos. Wundt también reconoció esta naturaleza dual del habla; concibió las oraciones 
como lineales y, al mismo tiempo, existiendo en su totalidad en la conciencia del hablante. 
Esta idea de dualidad de alguna manera pervive, implícita o explícitamente, en muchos de 
los modelos actuales de producción del lenguaje (Jay, 2003). 

En el instante en que nos disponemos a hablar partimos inicialmente de una intención 
comunicativa de decir algo. Esta intención previa, que James identificaba con un estado de 
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conciencia, corresponde a un momento que no es específico de la actividad lingúística. Los 
procesos cognitivos y motivacionales comprometidos en esta primera fase no son exclusivos 
del lenguaje y atañen a facultades mentales «horizontales», comunes a toda actividad 
cognoscitiva. La persona selecciona el contenido de su mensaje a partir de representaciones 
ya activadas donde entran en juego, además de sus pensamientos y conocimientos previos, 
sus deseos, temores y experiencia emocional en su conjunto. A partir de aquí, ese mensaje 
inicial tiene que ser transformado y revestido de una forma verbal para que pueda ser 
comunicable a través del lenguaje. El hablante tiene que construir oraciones significativas y 
gramaticalmente aceptables dentro de su lengua; es decir, debe codificar y formular el 
mensaje haciendo uso de su conocimiento gramatical y léxico. Finalmente, dichas oraciones 
tienen que ser pronunciadas por los órganos fonoarticuladores, para transformarse en una 
conducta explícita y externa, que pueda ser analizada por su interlocutor. 
Por lo tanto, aunque existe una amplia diversidad de modelos, como se verá más adelante, la 
mayoría de los autores reconocen la existencia de tres niveles de procesamiento en la 
producción del lenguaje, uno conceptual o de planificación, un nivel lingúístico de 
construcción de las estructuras sintácticas y selección de las palabras que se insertan en esas 
estructuras y, finalmente, un nivel fonológico para la generación de los fonemas y su 
posterior articulación. 
Aquí seguiremos en buena medida los pasos propuestos por el modelo de Levelt y asociados. 
+ Planificación conceptual del mensaje 
Levelt (1989, 1999) y otros autores distinguen una primera fase de planificación o de 
conceptualización, en la que los hablantes generan internamente un mensaje, seleccionando 
su contenido comunicativo. Esta fase tiene un carácter intencional y en ella el individuo se 
sirve de su conocimiento general del mundo y del modelo de situación que ha elaborado, 
para seleccionar unos contenidos o «ideas» frente a otras y establecer cierto orden entre ellas. 
El resultado de la conceptualización es un mensaje preverbal. 
Estas primeras operaciones de planificación del mensaje no son de naturaleza lingúística, 
puesto que no entrañan la utilización de conocimiento gramatical. Implican la concepción, 
por parte del hablante, de un determinado significado acerca de lo que pretende comunicar y 
de una intención comunicativa. Sea cual fuere el código exacto que utilicen estas primeras 
representaciones mentales, ha de ser, necesariamente, independiente de cualquier lengua 
específica, ya que el mismo contenido se puede expresar en distintos idiomas e, incluso, por 
otros medios distintos, como gestos, dibujos, símbolos lógicos, etc. Por consiguiente, debe de 
tratarse de un código de representación común a todos los hablantes de distintos idiomas, que 
no puede ser estrictamente «lingúístico» porque, en ese caso, sería imposible traducir las 
ideas de un idioma a otro. En realidad, se trata de una cuestión central, no ya en la psicología 
del lenguaje, sino en la psicología cognitiva en general, porque tiene que ver con un 
interrogante básico en torno a la naturaleza de la representación del conocimiento humano. 
De algún modo, los mensajes se encuentran codificados en forma de unidades individuales 
abstractas de significado sujetas a valores de verdad. Estas representaciones preverbales de 
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los mensajes deben contener información acerca de los referentes, o sea, los objetos o 
entidades sobre los que se asevera algo, y los predicados básicos, o aquello que se asevera 
sobre los referentes. Aquí, Levelt (1989) distingue dos niveles; procesos de 
macroplanificación, en los que el hablante organiza las grandes líneas de su discurso global y 
debe tomar dos decisiones sobre el contenido del mensaje: la información específica que va a 
aparecer en el enunciado y el orden en que va a presentar dicha información, y procesos más 
locales de microplanificación, en los que el hablante adopta una perspectiva, un punto de 
vista. El resultado de la acción coordinada de ambos procesos sería una representación 
preverbal de cada oración, que en realidad correspondería a la estructura profunda de las 
gramáticas generativas. 

+ Codificación gramatical y lexicalización 
El resultado de la planificación del mensaje es una representación preverbal de la oración, 
que debe ser codificada lingiiísticamente para adquirir un formato verbal. Esta 
transformación comprende la selección de los conceptos léxicos apropiados del vocabulario 
del hablante y la construcción de la estructura sintáctica en la que éstos se insertan. 
Hablamos de operaciones que generalmente no son accesibles a la conciencia, al igual que 
sucede en los procesos de comprensión del lenguaje; reclaman nuestra atención sólo si hay 
un fallo o disrupción. Sin embargo, al contrario que en la comprensión, estas disrupciones 
son habitualmente eventos públicos observables, de manera que los errores del habla y otros 
fallos, como ya se ha mencionado, revelan información valiosa al respecto. 
El hablante debe pasar de la semántica a la sintaxis; desde entidades conceptuales, no 
lingúísticas, a entidades ya lingúísticas relacionadas entre ellas. Se trata de un paso obligado 
que es contemplado por la mayoría de los modelos de producción y bastante discutido en sus 
detalles. Aquí hay dos operaciones básicas que debe ejecutar el hablante de forma 
automática, sin ser consciente de ellas: la selección léxica, y la construcción del marco 
estructural sintáctico, es decir, la selección de palabras y su relación sintáctica. 
Construcción de la estructura sintáctica 
Uno de los primeros problemas de esta fase consiste en especificar qué elementos servirán 
como sujetos de la incipiente emisión verbal y cuáles actuarán como objetos, y de qué clases. 
Esta proyección entre papeles conceptuales y relaciones sintácticas mo es una relación 
sencilla de uno a uno, como pudiera parecer a simple vista. No hay que olvidar que las 
lenguas, así como tienen léxicos distintos, disponen de sintaxis diferentes en muchos 
aspectos. Por ejemplo, sin salimos del tronco indoeuropeo, el francés y el español, al revés 
que el inglés, sitúan muchos adjetivos después del nombre; el español permite la omisión del 
sujeto pronominal, lo que no sucede en inglés y mucho menos en francés; el holandés sitúa el 
verbo al final de oraciones subordinadas; el alemán carece de preposiciones pero declina el 
final de las palabras, etcétera. 
¿Qué va antes: la selección léxica o la estructura sintáctica? Se trata de un cuestión 
controvertida sobre la que no hay acuerdo. Algunos autores se decantan por una selección 
léxica previa a la creación del marco estructural, es decir, se trata una visión en la que la 
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construcción sintáctica se halla «guiada lexicalmente». Otros autores han mantenido la 
hipótesis de la «sintaxis primero», según la cual, la estructura sintáctica se construye primero 
y luego se insertan en ella las palabras. Su principal apoyo reside en el hecho de que en la 
mayoría de los errores del habla la palabra errónea pertenece a la misma categoría gramatical 
que la palabra pretendida, lo cual evidencia quizá la existencia previa de un corsé sintáctico. 
Probablemente, la respuesta se halla alejada de una posición extrema; por una parte, no hay 
pruebas que demuestren que se seleccionan todas las palabras clave del enunciado para 
después combinarlas entre sí, y, por otra, es imposible planificar una estructura sintáctica sin 
tener ningún conocimiento de cuáles serán las piezas léxicas que se van a emplear. 

En todo caso, parece que los verbos desempeñan un papel especial, porque podría decirse 
que muchos ya «vienen con la estructura puesta». 


Complemento 
circunstancial | Objeto indirecto 
de lugar 


Sujeto Sujeto 


Objeto directo Objeto directo 


Figura 10-9. Estructura de los verbos «poner» y «dar». 

Por ejemplo, «dar» implica alguien (sujeto) que da algo (objeto directo) a alguien (objeto 
indirecto) (Fig. 10-9); de modo que, si seleccionamos ese verbo en nuestro vocabulario 
mental, estamos ya esbozando una estructura con huecos para el sujeto, el objeto directo y el 
objeto indirecto, y esos huecos o slots esperan ser rellenados por otros elementos léxicos. El 
verbo «poner» implica alguien (sujeto) que coloca algo (objeto) en un sitio (complemento 
circunstancial de lugar). Todos los verbos transitivos (tener, comprar, hacer, etc.) presuponen 
un objeto directo, mientas que los intransitivos (dormir, entrar, ayudar, etc.) no lo hacen; 
«entrar» Carece de objeto, pero implica un lugar donde se entra (complemento 
circunstancial), «ayudar» implica a alguien a quien se ayuda (objeto indirecto), etc. Así pues, 
en relación con la pregunta anterior, es probable que suceda algo intermedio: en un primer 
momento se seleccionan una o varias palabras clave, seguramente un nombre o un verbo que 
determina una estructura por sus propiedades de subcategorización e inmediatamente 
después se insertarían los restantes elementos léxicos en los «huecos» (slots) de la estructura. 
Estos últimos, a su vez, podrían generar nuevas subestructuras que completarían la inicial. 

Todas estas operaciones se llevarían a cabo en un plano funcional de cierta abstracción, sin 
posiciones fijas claramente marcadas, como lo demuestra el hecho de que la mayoría de los 
errores del habla en los que hay un intercambio de palabras se produce entre sintagmas 
distintos y sólo una minoría dentro de un mismo sintagma. Cabe recordar que los sintagmas 
son los constituyentes de las oraciones, por ejemplo «aquellos chicos de amarillo» es un 
sintagma nominal, «jugaron un partido de fútbol» es un sintagma verbal, «en el campo del 
Retiro» es un sintagma proposicional, etc. El hecho de que se intercambien palabras entre 
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ellos significa que en un primer momento se está operando sobre representaciones más 
amplias. Por ejemplo, «tu coche se queda sin padre», en lugar de «tu padre se queda sin 
coche» (Del Viso, 1990). 

A continuación se pasaría a un nivel posicional, en el que se fija el orden de los principales 
elementos: qué sintagmas van antes y cuáles después, y, dentro de ellos, qué orden siguen 
sus componentes. Aquí es llamativo el hecho de que la mayoría de los errores del habla en 
los que hay un intercambio de sonidos suceden ya en el interior de un sintagma. Las 
operaciones de fijación del orden de los elementos verbales se realizan a través del 
ensamblaje de los distintos componentes y de su inflexión. El primero se lleva a cabo cuando 
el hablante crea una jerarquía que impone una organización de unos constituyentes sobre 
otros, de manera que la estructura global determina finalmente un orden serial donde unos 
elementos van antes y otros después. Los procesos de inflexión rigen la organización a un 
nivel inferior y más detallado, de forma que determinan la realización gramatical última de 
los elementos léxicos y codifican diferentes propiedades morfosintácticas, dependiendo de la 
lengua en cuestión. Estos últimos procesos son revelados por errores característicos del habla 
en los que las palabras se quiebran (errores de stranding en la literatura anglosajona) por un 
intercambio selectivo de afijos, mientras permanecen ancladas las raíces en sus lugares 
correctos; por ejemplo, «.. .envoltaje o ropura» por «...envoltura o ropaje» (Del Viso, 1990). 
O, al revés, se intercambian las raíces y quedan anclados los afijos, como «hay médica de 
huelga» por «hay huelga de médicos». 

Lexicalización 

Es el proceso por el que seleccionamos las palabras de nuestro diccionario mental en la pro- 
ducción del lenguaje. Como ya se ha indicado, el hecho de que se aborde en segundo lugar 
no significa que necesariamente vaya después de construir una estructura sintáctica, dado 
que hay una estrecha dependencia entre ambos procesos, y ciertas palabras ya aportan un 
embrión de la estructura. Mediante la lexicalización se pasa de la representación semántica 
(significado) de las palabras a la representación fonológica de su forma (sonidos). En ese 
sentido, hay acuerdo general en que este proceso transcurre en dos etapas (Harley, 2009; 
Traxler, 2012): primero habría una activación del significado y luego se recuperaría la forma 
fonológica, y es en este paso cuando, si hay una disrupción, se produciría un fenómeno de 
«punta de la lengua», como ya se ha descrito. 

Según la teoría más conocida de los lemmas (Levelt, 1989, 1991), cada palabra estaría 
representada por un lemma que incorpora información semántica y también, no debe 
olvidarse, información sintáctica, y por un lexema o forma léxica que incorpora información 
morfológica y fonológica. Los lemmas serían amodales, no específicos de una modalidad, 
sea ésta auditiva, visual o gestual, y constituirían representaciones mentales que reflejan un 
estadio intermedio entre la activación de una idea y los sonidos del habla que se necesitan 
para expresar esa idea. Dependiendo de cada lengua, no siempre hay una alineación entre las 
ideas y los significados de las palabras; por ejemplo, en inglés o en castellano hay una 
correspondencia directa entre la idea de caballo hembra y un lemma (el de mare o yegua), 
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pero no para jabalí hembra, en cuyo caso habría que seleccionar y combinar dos conceptos 
léxicos (jabalí y hembra). 
Hay un gran volumen de investigación en apoyo de la hipótesis general de la existencia de 
estas dos etapas en el proceso de lexicalización -significado y forma-; sin embargo, la 
aceptación de la naturaleza del lemma no es unánime. Así, Caramazza (1997) considera a los 
lemmas una complicación innecesaria y pone en duda la evidencia empírica proveniente de 
los estados de «punta de la lengua», su principal soporte. En estos estados, el género 
gramatical de la palabra buscada es una información sintáctica que está disponible en una 
alta proporción de los casos, como ya se ha señalado; sin embargo, muchos estados de 
«punta de la lengua» permiten también una activación parcial fonológica (quien lo 
experimenta puede decir algún fonema de la palabra, generalmente el primero). Según 
Caramazza, debe de haber alguna dependencia entre ambos tipos de activación, puesto que, 
según el esquema de los lemmas, la información sintáctica es previa a la fonológica y no 
debería ser posible recuperar esta última sin recuperar la primera, pero el análisis de los datos 
revela una cierta independencia entre ambas activaciones. 

e Codificación fonológica 
La etapa anterior genera una estructura del lenguaje que constituye una representación 
léxico-sintáctica del enunciado. A partir de ella, el principal cometido consiste en garantizar 
que los sonidos de las palabras salen en el orden adecuado y con la prosodia -entonación, 
acento, duración-adecuada (Harley, 2009). Es decir, el hablante ha de elaborar un plan 
fonético de los sucesivos segmentos acústicos que materializan la estructura superficial de la 
oración para que puedan ser traducidos finalmente a un plan motor que especifique la 
secuencia de movimientos articulatorios. Aquí, el ámbito de planificación es más reducido, y 
la mayoría de los errores del habla de tipo fonológico, en los que se da un intercambio de 
fonemas, ocurren dentro de un sintagma. 
Nuestra experiencia fenomenológica da cuenta de una «voz interior«, un habla interna o 
subvocal accesible a nuestra conciencia y que Levelt (1989) equipara con el plan fonético. 
Esta representación es diferente de la representación conceptual inicial del mensaje 
preverbal, puesto que ya está constituida por palabras que se hallan organizadas en una 
secuencia de «sonidos» o, más exactamente, imágenes acústicas de los sonidos que 
configuran el enunciado verbal. La disponibilidad consciente del plan fonético permite que el 
hablante pueda examinarlo introspectivamente y tome la decisión de articularlo y hacerlo 
público o reservárselo para sí, como «voz interior» propia. Así pues, la accesibilidad de 
nuestra conciencia cierra un ciclo entre dos momentos extremos: el mensaje o contenido 
conceptual que deseamos expresar y el plan fonético o habla interna que se ha generado al 
final. Tanto uno como otro pueden ser inspeccionados mediante nuestra actividad mental 
consciente. Por el contrario, los subprocesos intermedios que han operado entre ambos 
momentos son automáticos y, por lo general, inaccesibles a nuestra conciencia. 
En la configuración del plan fonético se distinguen varios niveles o «estratos» de 
representación que se superponen y se acoplan entre sí en dos planos fundamentales: la 
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representación suprasegmental, que comprende la estructura prosódica y métrica, y la 
representación segméntala organizada sobre la base de la estructura silábica y sus segmentos 
constituyentes. La primera incorpora las propiedades «melódicas» y temporales del lenguaje 
que se hallan por encima de los segmentos individuales y que abarcan las variaciones en la 
frecuencia fundamental de la emisión, el acento y la duración e intensidad relativa de las 
unidades sonoras. Desempeña una función esencialmente expresiva de los estados 
emocionales del hablante y también sirve de marcador de entonación que ayuda a reconstruir 
la estructura sintáctica en el oyente, así como de indicador conversacional en el juego de 
cambios de turnos. La segunda tiene que ver con la estructura de las sílabas y sus segmentos 
o fonemas constituyentes. 

Como último paso, el plan fonético tiene que transformarse en un plan motor, una serie 
coordinada de órdenes motoras que darán lugar a la realización articulada del mensaje 
verbal, haciéndose así perceptible para el oyente. El papel que se le atribuye a las sílabas va a 
depender de los distintos modelos teóricos, pero cada vez es más evidente su importancia en 
estrecha conexión con la organización motora del habla. Por ejemplo, el modelo de Levelt, 
Roelofs y Meyer (1999), uno de los más influyentes, presupone la existencia de un silabario 
o repertorio de los movimientos articulatorios que se corresponden con las silabas más 
frecuentes de un idioma. 


MODELOS DE PRODUCCIÓN ORAL 
En el presente capítulo abordamos la producción oral del lenguaje; no obstante, en el 
recuadro 10-4 presentamos unas breves reflexiones sobre el lenguaje escrito. 


Recuadro 10-4. La escritura 

Desde hace ya bastante tiempo, pero de manera intensa en los últimos años, los seres 
humanos utilizamos otro medio, además del habla, para comunicar mensajes o expresar 
nuestros sentimientos: el lenguaje escrito. A través de la escritura podemos convertir 
nuestras ideas y sentimientos en signos gráficos que otras personas pueden leer y 
comprender. En este sentido, la escritura comparte muchos procesos con el habla, ya que 
también comienza con la planificación del mensaje que se quiere transmitir a nivel 
conceptual, la conversión de ese mensaje a formato verbal a través de la construcción de 
oraciones y de la selección de los elementos léxicos y, finalmente, la realización de los 
procesos motores para convertir los fonemas que componen las palabras en signos gráficos 
sobre un papel, en una pantalla de ordenador o en cualquier otro dispositivo electrónico. 

No obstante, hay diferencias importantes entre la producción oral y la producción escrita, 
pues mientras que en el habla existe una audiencia que está continuamente interactuando 
con el hablante, haciéndole preguntas, pidiéndoles aclaraciones y detalles, en la escritura 
falta esa interacción, dado que el escritor se encuentra solo, por lo que debe imaginarse la 
audiencia a la que dirigir su escrito y tiene que pensar en esos detalles y aclaraciones que el 
interlocutor, en este caso lector, necesita para comprender el mensaje. Igualmente, en el 
habla existe un contexto al que se puede referir el hablante en todo momento, a veces 
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incluso a través de gestos o referencias visuales, mientras que el escritor necesita construir 
todo el contexto y hacer las referencias explícitas para que el lector pueda entender lo que 
lee. Por el contrario, el escritor tiene la ventaja sobre el hablante de que puede pensar muy 
bien lo que va a escribir porque no tiene ninguna presión temporal e, incluso, puede corregir 
lo que ya ha escrito tantas veces como quiera hasta quedar satisfecho con el texto. De esta 
manera, en la escritura, además de los procesos de planificación, formulación y ejecución 
compartidos con el habla, existe el proceso de revisión del escrito (Hayes, y Flower, 1980). 
En la conversación oral todo sucede muy deprisa y, por lo tanto, no hay tiempo de pensar 
demasiado lo que se va a decir. En cambio, el escritor tiene todo el tiempo que desee para 
planificar detalladamente lo que va a decir y, además, puede revisar y corregir los escritos. 
Esto significa que puede hacer búsquedas exhaustivas de la información y seleccionar los 
aspectos más relevantes y adecuados para los objetivos del escrito. Asimismo, puede 
construir estructuras gramaticales más complejas y utilizar un vocabulario más rebuscado. 
Como consecuencia, el lenguaje escrito está mucho más cuidado que el oral en todos los 
niveles: mayor cohesión del discurso escrito, ideas más ordenadas, mayor complejidad 
sintáctica y vocabulario más extenso. El habla, en cambio, es mucho más fragmentada, las 
oraciones son más simples sintácticamente e, incluso, muchas veces incompletas y el 
vocabulario es más familiar (Cuetos, 2009). 

Al menos, estas diferencias son notables cuando nos referimos a las formas clásicas de es- 
critura, es decir, a las novelas, artículos de periódicos y revistas, documentos oficiales, etc. 
Pero en los últimos años han surgido formas de escritura para comunicarse a través de los 
medios electrónicos (mensajes de texto, whatsapp, twiter, etc.) que, aunque se trate de 
mensajes escritos, realmente son más parecidos al habla, ya que hay una continua 
interacción entre los participantes, tienen un contexto común, etc., y no suelen revisar y 
corregir los escritos; como consecuencia producen discursos poco elaborados, con frases 
simples y palabras familiares e, incluso, muchas veces escritas de manera ortográficamente 
incorrecta o utilizando un sistema de notación abreviado como «tb» por «también» o «k» 
por «que». 

Incluso en los escritos clásicos hay diferencias importantes en función del tipo de texto y del 
estilo del escritor. No es lo mismo escribir un cuento que un ensayo, una noticia periodística 
o un artículo científico. Cada texto tiene su propia estructura y sus propias normas. 
Igualmente, cada escritor tiene su propio estilo. Todos deben realizar las operaciones de 
planificación, formulación y ejecución (y generalmente la de revisión) de una manera más o 
menos serial, es decir, planifican lo que van a decir, transforman esas ideas en formato 
verbal, ponen en marcha los programas motores y suelen revisar lo escrito, pero existen 
grandes diferencias en la forma en que se llevan a cabo esos procesos. 

Lo primero que hacen algunos autores, antes de ponerse a escribir, es planificar (o incluso 
escribir) un pequeño guión en el que aparecen los principales puntos que van a tratar y el 
orden en que se deben exponer. Después, utilizan ese guión para empezar a crear oraciones 
y, a continuación, teclean en el ordenador. Finalmente, leen esas oraciones para comprobar 
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que el escrito es correcto. Otros autores, sin embargo, siguen una estrategia totalmente 
distinta, puesto que prefieren ponerse a escribir para expresar todas sus ideas y, cuando 
terminan de escribir un borrador, se ponen a revisar el texto, a ordenar el escrito y a eliminar 
lo que no consideran relevante. Según Elbow (1973), esta estrategia es más creativa porque 
ni el propio autor sabe a dónde le llevará el escrito. Al no tener que estar preocupado por el 
estilo, puede concentrarse más en el contenido y es más fácil que surjan ideas nuevas. 
También es frecuente utilizar una estrategia intermedia, es decir, comenzar con un guión 
definido pero, a medida que surge alguna idea nueva, abandonar el guión para seguir por el 
camino que marque esa nueva idea. 

Diferentes autores han tratado de comprobar cuál de esas estrategias es mejor para conseguir 
textos bien escritos y creativos. Entre los primeros se encuentran Glynn, Britton, Muth y 
Dogan (1982) que en un experimento pedían a sus participantes que escribiesen un borrador 
con cuatro condiciones diferentes: con oraciones bien cuidadas, con oraciones completas 
pero sin cuidar la forma, con notas organizadas y sin notas. Encontraron que la condición en 
la que los participantes producían menos ideas era cuando tenían que cuidar las oraciones y 
en la que producían más ideas era cuando escribían sin notas. En un experimento similar, 
Kellog (1988) pedía a los participantes que escribiesen una carta de negocios también con 
cuatro condiciones diferentes fruto de la combinación de dos variables: calidad del borrador 
(preocupándose de la forma y sin preocuparse de ella) y esquema (haciendo un esquema 
previo y sin esquema previo). Kellog encontró que los participantes escribían cartas de 
mayor calidad y con mayor número de ideas en la condición con esquema que en la 
condición sin esquema. No había en cambio diferencias en cuanto a la variable calidad del 
borrador, dado que la ejecución era similar cuando se preocupaban de la forma que cuando 
no se preocupaban. 


A lo largo de las últimas décadas se han propuesto distintos modelos teóricos para explicar 
los hallazgos procedentes de la investigación sobre producción del lenguaje, tanto del 
análisis de los corpus de errores del habla o del fenómeno «punta de la lengua», como de los 
estudios experimentales con tiempos de reacción. Cada modelo posee sus puntos fuertes y 
débiles particulares y no se puede decir que exista un modelo único claramente superior al 
resto en potencia explicativa de todos los datos empíricos. Por otra parte, muchos cuentan 
con sus propias simulaciones computacionales o programas informáticos que, de acuerdo con 
determinados parámetros numéricos, se comportan emulando al sistema natural en la 
selección y generación de palabras. 

La mayoría de los modelos coincide en suponer la existencia de tres niveles básicos de 
representación: significado, representaciones léxicas y fonemas. Las diferencias surgen 
cuando se entra en el detalle de su funcionamiento y de cómo se relacionan entre sí. A 
grandes líneas podrían agruparse en modelos discretos o modulares y modelos interactivos 
(Rodríguez-Ferreiro y Cuetos, 2012). En los primeros, sus autores entienden que las distintas 
etapas de procesamiento actúan en serie como si fueran módulos relativamente 
independientes, de manera que cada subproceso no se inicia hasta que ha finalizado el 
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anterior; así, la selección fonológica no comenzaría hasta que hubiera terminado la léxica, y 
ésta no empezaría hasta que finalizara la semántica. Por el contrario, los modelos interactivos 
consideran que los procesos actúan en paralelo, lo que significa que pueden estar 
funcionando varios de ellos a la vez. Otro punto importante es el flujo de la activación: en los 
modulares sólo sería hacia adelante, desde las primeras etapas a las últimas, mientras que en 
los interactivos la información viajaría de forma bidireccional, en ambos sentidos a la vez. 
Un tipo intermedio lo constituirían los denominados modelos en cascada, ya que defienden 
un procesamiento en paralelo, donde las distintas operaciones no tienen que esperarse unas a 
otras, pero en ellos la información sólo fluye en un sentido hacia adelante. 

+ Modelos discretos o modulares 
Uno de los modelos modulares más representativos es el propuesto por Merrill Garrett 
basándose sobre todo en el análisis de los errores del habla (Garrett, 1975, 1984), en el que 
se defiende que la producción del lenguaje atraviesa una serie de etapas de procesamiento 
discretos. Distingue tres niveles principales de procesamiento: el nivel del mensaje o concep- 
tual, el de la oración y el nivel articulatorio o motor (Fig. 10-10). 


Procesos inferenciales 


(Representación del mensaje) 


Selección léxica Determinación de las 


estructuras funcionales 


E (VW) IS) (N) N) 
OT CAE TE IT IA MEA 


Pa Asignación léxica 


(Representación del nivel funcional) 


Recuperación de Selección de marcos 


las formas léxicas del nivel posicional 


| e 


a del Asignación de la estructura segmental y prosódica 


Interpretación y colocación 
de la información nodal 


| 


(Representación del nivel posicional) 


Figura 10-10. Modelo de producción oral de Merrill Garrett. Adaptado de Garrett (1984). 
En el primer paso, los procesos de inferencia darían lugar a una representación del mensaje 
que debe empezar a tomar cuerpo lingúístico a través de la selección léxica y la 
determinación de las estructuras funcionales. Donde más se focaliza el modelo es en el nivel 
siguiente de las oraciones, en el que distingue dos subniveles: el funcional y el posicional. En 
el nivel funcional se seleccionan las formas léxicas, y su contenido semántico se asigna a los 
papeles sintácticos, como sujeto u objeto, pero aún no se fija el orden de las palabras. Es en 
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el nivel posicional cuando se especifica la posición de las palabras dentro del marco 
sintáctico, así como sus relaciones de concordancia gramatical; esto sirve de base para 
generar ya una representación fonológica, de «cómo se pronuncia» la oración con su 
estructura prosódica y segmental -de segmentos fonéticos-, lista para ser articulada en el 
último paso, de tipo motor. Garrett estableció una clara distinción entre los papeles 
desempeñados por las palabras de contenido, o clase abierta, y las palabras de función, o 
clase cerrada; las primeras serían recuperadas por su contenido semántico ya en el nivel 
funcional, mientras que las segundas, que son indispensables para organizar la estructura 
sintáctica, no serían seleccionadas hasta el nivel posicional. El análisis de las pausas en el 
lenguaje espontáneo confirma esta distinción, de modo que las interrupciones para búsqueda 
léxica sólo se producen ante las palabras de clase abierta. 

Otros modelos se han centrado más en los procesos de selección de las palabras habladas. El 
modelo más influyente de este tipo es, sin duda, el de Levelt et al. (Levelt, 1989; Levelt, 
Roelofs y Meyer, 1999), que surge para dar cuenta sobre todo de los datos obtenidos con 
tiempos de reacción en un gran número de experimentos de nombrado de objetos. Parte de la 
base de que la producción del lenguaje atraviesa una serie de estadios ordenados y que la 
activación va pasando de unos a otros sin retroalimentación hacia atrás. Cada etapa genera 
un tipo de representación que supone la materia prima, el input, para la siguiente. 

En la figura 10-11 se muestra una adaptación al 2” 
castellano del esquema original de Levelt, Roelofs y 
Meyer (1999) sobre los pasos 


epto léxi que sigue la selección y generación de una palabra. 
J 

Selección 
léxica 


7 
>, 


Preparación 
conceptual 


Gran parte de los procesos descritos en el apartado 
anterior sobre niveles de procesamiento en la 
producción del lenguaje guardan relación con la 


y 
Codificación 
morfológica 

Morfema 

J 


Codificación 
fonológica 
Silabización 


! 


Supervisión 


! 


Codificación 
fonética 


Articulación 


! 


Sonidi 


Figura 10-11. Modelo de producción oral de Levelt. 
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concepción general de este modelo. Se asume que la 
información pasa por una serie de etapas que actúan de 
forma discreta o modular y que van desde la 
preparación conceptual a la articulación de los sonidos; 
cada etapa de procesamiento produce un tipo distinto 
de representación que se va aproximando a la 
representación sonora. 

Durante la fase de preparación conceptual, equivalente 
al nivel del mensaje del modelo de Garrett, se elige el 
concepto léxico que expresa el mensaje que se desea 
transmitir. No es un paso sencillo, puesto que un 
mismo objeto o evento puede estar asociado a 
diferentes conceptos léxicos; así, para nombrar un 
asiento pueden emplearse los conceptos de silla, 


mueble, butaca, etc. Asimismo, no siempre existe un único concepto léxico para lo que se 
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pretende comunicar y hay que recurrir a más de uno. A continuación se selecciona el lemma 
desde el léxico o vocabulario mental. El lemma es una representación que contiene, además 
del contenido semántico, la información sintáctica asociada a la palabra. Este proceso de 
selección es rápido y muy robusto, ya que ocurre a razón de dos o tres veces por segundo en 
un léxico que contiene decenas de miles de unidades de información y la tasa de error es 
sorprendentemente baja: en el rango de 1%. 
Una vez seleccionado el lemma, el hablante debe dar el paso desde la información 
conceptual-sintáctica al dominio fonológico-articulatorio. Este paso, como se ha mencionado 
con anterioridad, tiene cierta fragilidad y puede interrumpirse causando un estado de «punta 
de la lengua». La tarea siguiente es preparar los gestos articulatorios apropiados para la 
palabra seleccionada, por lo que hay que construir la forma fonológica en dos etapas: la 
codificación morfológica, en la que se activa el morfema adecuado de acuerdo con el 
contexto oracional (rasgos de género, número, tiempo y persona verbal), y la codificación 
fonológica o silabización, que genera la palabra fonológica o secuencia de sílabas que 
corresponde al morfema flexionado. 
Durante la codificación fonética se activan los planes articulatorios necesarios para producir 
la estructura de sílabas construida en el estadio anterior. Aquí, según los autores, el sistema 
se sirve de un silabario, es decir un repertorio de gestos o movimientos articulatorios 
correspondientes a las sílabas más frecuentes de un idioma. Finalmente, en la etapa última de 
articulación se ejecutan de forma motriz los planes articulatorios gracias a la entrada en 
acción de las estructuras neuronales y los músculos apropiados. Un aspecto importante de 
este modelo es que el hablante se oye a sí mismo mientras habla y pone en marcha un 
proceso de supervisión o automonitorización de su propia respuesta sonora con el fin de 
detectar cualquier error y corregirlo sobre la marcha. 
+ Modelos interactivos 

En los modelos interactivos existe una interacción desde el principio entre los distintos 
niveles de representación. El modelo más representativo es, con diferencia, el de Gary Dell 
et al. (Dell, Chang y Griffin, 1999), también denominado el modelo «de dos pasos», porque 
implica la doble transferencia de información entre tres niveles de procesamiento: semántico, 
léxico y fonológico (Fig. 10-12). 

[ 


Léxico 


Figura 10-12. Esquema del modelo interactivo de Dell, Chang y Griffin (1999). Las conexiones son bidirecciona- 
les. Adaptado de la versión castellana de Rodríguez-Ferreiro y Cuetos (2012). 


booksmedicos.org 


28 


Psicología del Lenguaje — TEMA 10 


Cabe destacar que, en este modelo, desde el primer momento en que se inicia la activación 
en el sistema semántico, ésta empieza a fluir hacia el nivel léxico, y de aquí al fonológico, 
por lo que los tres niveles están operando simultáneamente sin espera entre ellos. 
La información semántica activa la representación léxica de la palabra y, además, a otros 
nodos léxicos que comparten rasgos del significado y que actúan como competidores. Al 
mismo tiempo, la activación sigue fluyendo al nivel fonológico, por lo que se activarán tanto 
los fonemas de la palabra en cuestión como los de sus competidores. En este punto hay que 
señalar una característica relevante del modelo y es que la conexiones son bidireccionales: la 
activación viaja en los dos sentidos, hacia abajo, como hemos visto, y hacia arriba, desde el 
nivel fonológico al léxico y de éste al semántico. Cuando los fonemas se activan, retrotraen 
activación hacia los nodos léxicos, reforzándolos. 
En este modelo, los fonemas se activan al mismo tiempo que los nodos léxicos, equivalentes 
a los lemmas. Este detalle establece predicciones empíricas distintas de las del modelo de 
lemmas, en el que éstos deben activarse antes que los fonemas. El modelo explica bien la 
elevada tasa de errores mixtos que ocurren en el habla espontánea, es decir, aquellos en los 
que la palabra errónea guarda a la vez una relación semántica y fonológica con la pretendida; 
por ejemplo «pato» por «gato», o en inglés, 'oyster' (ostra) por 'lobster' (langosta). En estos 
errores mixtos, la palabra errónea recibe activación no sólo semántica, sino también 
fonológica, por lo que compite mejor con la correcta. El modelo, por lo tanto, podría explicar 
por qué esta clase de errores aparecen con una frecuencia mayor de lo esperado 
estadísticamente. 
Otro modelo interactivo de gran influencia es el de Stemberger (1985), que plantea un 
conjunto de componentes que se influyen mutuamente mediante conexiones bidireccionales 
(Fig. 10-13). Dada su arquitectura, el modelo establece que, a partir del significado, hay una 
a AS interacción entre las palabras 
OS y la sintaxis, de manera que 
los niveles léxicos y 
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Figura 10-13. Modelo interactivo de Stemberger. Adaptado de Stemberger (1985). todos rojos» (en lugar de «tua 
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lengua está toda roja»), el verbo aparece en singular y no en plural y los restantes elementos 
cambian el género gramatical. También se da una interacción entre los elementos léxicos y la 
información fonológica, que se expresa en el hecho de que los errores se ven facilitados 
cuando las palabras confundidas son semejantes en su fonología («pandilla» por «plantilla»). 
+ Modelos en cascada 
Un tercer tipo intermedio entre los dos anteriores es el de los denominados modelos en 
cascada, como, por ejemplo, el modelo de Rapp y Goldrick (2000). Estos modelos 
comparten con los enfoques interactivos el hecho de asumir un procesamiento en paralelo, de 
forma que los distintos niveles de trabajo no necesitan esperarse unos a otros sino que 
pueden estar funcionando al mismo tiempo. Por otro lado, comparten con los modelos 
modulares el hecho de que el flujo de activación es unidireccional y sólo fluye en un sentido, 
hacia adelante -o de arriba abajo-, sin retroalimentación en sentido inverso, de manera que el 
procesamiento fonológico no influye sobre el procesamiento léxico, y éste no influye sobre 
el procesamiento semántico. 
En general, los modelos en cascada reciben este nombre, no sólo en la producción del 
lenguaje sino en cualquier otro ámbito de la psicología cognitiva, porque la información 
fluye de arriba abajo como si fuera una cascada continua entre los niveles superiores e 
inferiores. 
Al contrario que en los modelos modulares, cada nivel de procesamiento no necesita esperar 
a que el nivel superior acabe completamente su trabajo para empezar a funcionar, sino que 
puede operar desde el momento en que partes de la información ya están disponibles y se 
«cuelan» hacia abajo desde los niveles superiores. En la práctica, esto supone que los niveles 
inferiores pueden estar funcionando simultáneamente antes de que acaben los superiores, 
hecho que no sucede en los modelos estrictamente modulares, en los que cada módulo debe 
completar su trabajo de forma en-capsulada antes de que los módulos siguientes tomen el 
relevo. 


LA CONVERSACIÓN 

Hasta ahora se ha examinado el conjunto de procesos que intervienen desde la primera 
intención de comunicar algo hasta su materialización en el habla, pero no debe olvidarse que 
esto sucede normalmente en un contexto más amplio de interacción verbal entre las personas, 
es decir, en el seno de las conversaciones. 

Originalmente, la palabra discurso era sinónimo de conversación, y así lo revela su 
procedencia etimológica del latín discurxus o «conversación»; aquí nos centraremos en su 
acepción de interacción comunicativa. 

Se ha de partir de la idea de que la conversación, o el discurso en interacción, es básicamente 
una actividad intencional y, al mismo tiempo, cooperativa. Cuando una persona interactúa 
verbalmente con una o varias personas, lo hace con un propósito determinado, es decir, lo 
hace «para algo»; en palabras de Austin (1962), se trata de «actos de habla» que tienen un 
componente o fuerza ilocutiva. A su vez, la conversación se rige por un deseo de 
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cooperación entre los interlocutores, de forma que la aportación que hace el hablante en cada 
momento responde a unas condiciones de participación en las que existe un grado muy 
importante de colaboración mutua. Se trata del principio de cooperación que el filósofo 
británico Paul Grice formuló a través de sus cuatro conocidas máximas (Grice, 1975): 
+ Máxima de la cantidad: el mensaje debe ser informativo, pero no más de lo necesario. 
+ Máxima de la calidad: se debe decir aquello que se cree que es cierto; no decir nada 
sobre lo que se cree que es falso o sin la suficiente evidencia. 
+ Máxima de la relevancia: el mensaje debe ser relevante para el propósito de la 
conversación. 
+ Máxima de la forma: el mensaje debe ser claro, evitando la confusión, ambigúedad u 
oscuridad en el lenguaje. 
Las conversaciones se degradan rápidamente si se apartan de estas máximas, que fueron 
posteriormente complementadas por muchas otras. Un aspecto esencial de las 
conversaciones es aquello que comparten los interlocutores. Herbert Clark concibe la 
conversación como una actividad conjunta en la que ambos participantes comparten un 
«conocimiento común» basado en la copresencia física y lingiística en la situación de habla 
y en el hecho de pertenecer a la misma comunidad o grupo social; al mismo tiempo, 
comparten también la «creencia común» de que el oyente comprende lo que el hablante 
intenta comunicarle, y viceversa (Clark, 1994). 
Muchas de las hipótesis derivadas del principio griceano de cooperación se han estudiado 
experimentalmente a través del paradigma de comunicación referencial introducido por 
Krauss y Weinheimer (1964) (Fig. 10-14). 
El procedimiento consiste en que dos participantes, 
separados por una pantalla, se comunican en una 
situación muy estructurada, en la que uno de ellos da 
instrucciones para que el otro sea capaz de seleccionar 
en Cada ensayo un objeto o una figura entre varias 
posibles. Cada participante cuenta con el mismo 
conjunto de figuras y éstas no corresponden 
unívocamente a un objeto de la vida real, por lo que la 
referencia no es directa ni simple; de esta forma, los 
interlocutores se ven obligados a desarrollar diversas 
estrategias cooperativas en su interacción verbal para 
conseguir incrementar la eficacia en la tarea. Los 


Figura 10-14. Ejemplo de experimento de comunica- A . 
ción referencial en el que ambos participantes tienen resultados de diversos trabaj os llevados a cabo con 


las mismas figuras hechas con piezas del Tangram. To- $ . ale 
mado de Duff y Brown-Schmidt (2012), con autoriza €Ste paradigma confirman muchas de las predicciones 


ción de los autores 


establecidas por el principio de cooperación. Es 
interesante observar cómo los interlocutores cooperan recíprocamente gracias a un 
conocimiento compartido que van generando de forma creciente en el transcurso de la tarea y 
mejoran la eficacia comunicativa simplificando el lenguaje en las referencias repetidas al 
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mismo objeto o figura. Cuando este tipo de experimentos se aplica a niños y niñas de 
diferentes edades, se observa cómo, a medida que crecen, utilizan un lenguaje menos 
egocéntrico; por ejemplo, los más pequeños pueden referirse a una figura como «se parece a 
la camisa de papá», sin ponerse en el lugar del otro, que no conoce al padre. 

+  Deixis en la conversación 
El discurso conversacional se desarrolla en un contexto espaciotemporal que ambos 
interlocutores comparten simultáneamente; este hecho le confiere un carácter esencialmente 
deíctico, en virtud del cual los referentes son identificados y localizados en relación con el 
espacio y el tiempo actual, como señaló el lingiiista Búhler. Gracias a su naturaleza deíctica, 
la conversación se enraiza con la situación física en la que ésta se desarrolla, a través de los 
mecanismos lingúísticos que cada idioma dispone para ello. La deixis, que significa 
señalamiento o indicación en un espacio compartido y que, en su origen, guarda relación con 
el dedo índice, comporta un grado de complejidad cognitiva muy superior al que pudiera 
parecer a simple vista. De hecho, la investigación sobre el uso de los términos espaciales 
como «aquí», «allí», «arriba», «abajo», «delante», «detrás», «derecha», «izquierda» y otros, 
pone de manifiesto la existencia de diferentes grados de demanda cognitiva en relación con 
un sistema de tres ejes subjetivos y orientados egocéntricamente en torno al sujeto, uno de 
«verticalidad percibida» del hablante respecto a la fuerza de la gravedad, y dos ejes 
horizontales «delante-detrás» y «derecha-izquierda», con distintos niveles de prominencia 
psicológica. Esta experiencia subjetiva no es exclusiva del lenguaje y está presente también 
en la percepción visual (de Vega, 2008) y en las experiencias sociales y cognitivas 
(Graumann y Sommer, 1989). 

+ Estructura de la conversación 
La conversación es, básicamente, una actividad de colaboración en la que ambos 
interlocutores cooperan para garantizar un intercambio adecuado de información. Aunque 
existen muchas variaciones situacionales, en general cabe distinguir tres momentos. 
Apertura de la conversación. ¿Cómo se inicia una conversación? Hay infinidad de formas, 
pero en la práctica se efectúa mediante un número reducido de procedimientos. Casi siempre 
de modo vocativo, dirigiéndonos al otro hablante: «oye, Juan»; también puede hacerse 
pidiendo información, «¿tiene hora?», u ofreciéndola, «¿está buscando una dirección?». Son 
muy comunes también las fórmulas estereotipadas de inicio de contacto, «hola», o un lugar 
común como hablar del tiempo atmosférico, etcétera. 
Turnos de habla. Una de las características más llamativas de la conversación es su fluido 
discurrir a través de la alternancia de turnos en ausencia de reglas formales. De este modo se 
evitan o minimizan los solapamientos del habla que, en general, suelen ocupar un porcentaje 
reducido del tiempo total. Sacks, Schegloff y Jefferson (1974) consideraron que el uso de 
turnos en la conversación sigue tres reglas, en particular cuando hay más de tres 
intervinientes. La primera es que quien está hablando puede elegir, mediante indicios 
verbales o gestuales, quién será el próximo hablante; la segunda es que, si no se hace uso de 
la primera, cualquier hablante puede tomar la siguiente palabra, y la tercera, que la persona 
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que está hablando puede proseguir en el turno, aunque no está obligada a ello. Duncan y 
Fiske (1985) han estudiado la importancia de los gestos para señalar que un turno está a 
punto de acabar; especialmente, la mirada, los gestos con las manos, los gestos faciales, la 
posición del cuerpo y ciertas señales vocales. Observaron que los cambios de turno ocurren 
principalmente en las pausas vacías —las que no están ocupadas por un sonido de 
continuación como «eeh», «mmm»-, cuando hay un apagamiento de la intensidad vocal, cese 
de gesticulaciones, relajación del cuerpo o emisión de ciertas expresiones estereotipadas. 
Cierre de la conversación. Las conversaciones no se suspenden callando bruscamente los 
hablantes y yéndose del lugar de la conversación. Antes se dan ciertas señales de precierre 
que anuncian la proximidad del fin de la conversación (Jay, 2003). Luego la conversación se 
cierra de mutuo acuerdo con un «adiós» recíproco. Además, la gente emplea un conjunto de 
estrategias para poner fin a la interacción conversacional y, probablemente, su reanudación 
futura en otra ocasión, por ejemplo, «tengo una llamada», «se está haciendo tarde», «mañana 
lo hablamos», etcétera. 

En el recuadro 10-5 se muestra la importancia de la interactividad en la comunicación, y, en 
particular, a través de las redes sociales donde no existe el contacto físico directo. 


Recuadro 10-5, Interactividad en el twitter de los políticos 


La interactividad es un factor clave en las reacciones afectivas a través de Internet. Lee y 
Shin (2012), de la Universidad Nacional de Seúl, realizaron un experimento por Internet con 
264 participantes que accedían al twitter de políticos varones candidatos en unas elecciones. 
Había dos tipos de twitters: a) muy interactivos, en los que el candidato intercambiaba 
mensajes con sus seguidores, y b) poco interactivos, en los que el candidato insertaba 
mensajes pero se involucraba poco en conversaciones con los seguidores. 

La comparación entre ambos tipos reveló que los twitters interactivos daban lugar a una eva- 
luación más positiva del candidato y a una mayor intención de voto. Por otra parte, la 
condición interactiva generó más pensamientos positivos hacia el candidato, pero sus 
seguidores identificaron peor los temas defendidos por él. 
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RESUMEN 


El ser humano se comunica transmitiendo mensajes a través de la producción de habla 
o lenguaje oral. Teniendo en cuenta que articulamos más de un centenar de palabras 
por minuto organizadas en frases, se comprenden la complejidad y la eficiencia de los 
mecanismos que lo hacen posible. Estos procesos parten de una intención inicial de 
comunicar algo y, a través de diversos niveles de procesamiento, se materializan en 
una cadena de sonidos articulados que el oyente descifra. 

Dada la dificultad metodológica de acceso y control de esa primera intención 
comunicativa, los procesos de producción han recibido comparativamente menos 
atención que los de comprensión. Sin embargo, hoy se dispone de un importante 
volumen de investigación basado en diversas fuentes empíricas, tanto observacionales 
como experimentales. La principal fuente de datos observacionales ha sido 
tradicionalmente el análisis de los errores espontáneos del habla y el estudio de 
fenómenos como el de las palabras en «la punta de la lengua». A ellos se suman la 
evidencia neurológica aportada por los pacientes con lesión cerebral y los estudios 
experimentales cronométricos, particularmente los de nombrado de objetos o dibujos. 
Unos y otros aportan valiosas pistas sobre los mecanismos psicolingúísticos que están 
detrás de la generación del lenguaje. 

La mayoría de los autores y modelos teóricos proponen tres niveles básicos de 
procesamiento en la producción lingúística: uno conceptual o de planificación inicial 
del mensaje, un nivel de codificación y lexicalización para encontrar las palabras 
adecuadas en la memoria y organizarías en estructuras sintácticas y, finalmente, un 
nivel fonológico para la generación de los fonemas y su posterior articulación en 
sonidos lingúísticos. 

Los modelos teóricos que, con puntos fuertes y débiles, intentan explicar los datos 
empíricos disponibles son fundamentalmente de tres tipos: de carácter discreto O 
modular, constituidos por componentes de funcionamiento relativamente 
independientes, como los de Garrett y Levelt; interactivos, como los de Dell o 
Stemberger, e intermedios o en cascada. 

La producción oral del lenguaje sucede en el contexto natural de la conversación. En 
ella, la interacción verbal se rige por el principio de cooperación y tiene un carácter 
deíctico al desarrollarse en un contexto espaciotemporal que comparten los 
interlocutores. Pese a la variedad de situaciones, la mayoría de las conversaciones 
presentan una estructura de tres etapas diferenciadas: apertura, turnos de habla y 
cierre de la conversación. 
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Preguntas de reflexión 


¿Qué ventaja aporta la coarticulación al procesamiento del lenguaje? 

¿Cuáles son las principales fuentes de datos en el estudio de la producción del 
lenguaje? 

Escribe cuatro errores del habla que hayas observado en situaciones naturales y 
clasifícalos. 

¿Está disponible la información sintáctica de la palabra durante un estado de «punta de 
la lengua»? Razona la respuesta a la luz de la evidencia experimental. 

¿Cuáles serían las principales características que distinguen a los modelos modulares 
de los interactivos? 

Enuncia las cuatro máximas de Grice sobre la conversación. 
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LECTURA 


Objetivos de aprendizaje 
Al finalizar el capítulo el alumno será capaz de: 
e Entender el sistema de procesamiento lector. 
e Conocer las principales metodologías experimentales que se emplean en la 
investigación sobre la lectura. 
e Conocer los principales modelos de lectura. 
e Identificar las bases neurológicas responsables de la lectura. 


INTRODUCCIÓN 

En la sociedad actual alfabetizada y de las nuevas tecnologías es imprescindible dominar el 
lenguaje escrito. A pesar de que su uso es relativamente reciente, pues hace sólo unos 5.000 
años que se inventó y sólo dos siglos desde que se empezó a usar de manera masiva (Recuadro 
11-1), en la actualidad la mayor parte de la información nos llega a través de los textos 
escritos. 


Recuadro 11-1. Orígenes de la escritura 


Desde hace miles de años la especie humana viene tratando de transmitir mensajes a través de 
signos escritos. Primero se utilizaron los dibujos, tan abundantes en las cuevas prehistóricas, 
algunos con una antigiiedad de más de 30.000 años. Las primeras pinturas rupestres 
representaban objetos, animales o escenas de caza. Después los dibujos se fueron 
esquematizando y sofisticando (Gelb, 1963) para poder representar conceptos abstractos o 
escenas más complejas. De esta manera, en la mayoría de las cuevas, junto con los dibujos de 
animales suelen encontrarse series de puntos, líneas paralelas, curvas, etc., que posiblemente 
se utilizaron para llevar la contabilidad o marcar el paso del tiempo, y figuras de manos 
pintadas con formas diferentes que quizá podrían proporcionar información sobre el número, 
la naturaleza o el movimiento de las presas de caza (Dehaene, 2009). Es decir, que las pinturas 
prehistóricas probablemente sirviesen para transmitir mensajes, por lo que podría 
considerarse un precursor de la escritura. De hecho, a este tipo de escritura a través de los 
dibujos se la conoce con el nombre de escritura ideográfica. 

Sin embargo, el verdadero sistema de escritura surgió cuando los símbolos escritos se 
empezaron a usar para representar palabras en lugar de objetos o conceptos (Ellis, 1984). 
Cuando a cada palabra le corresponde un símbolo se habla ya de escritura logográfica. Los 
primeros sistemas logográficos surgieron en Oriente Medio, en la zona de Mesopotamia y 
Persia (lo que hoy en día se conoce como Irak e Irán) hace más de 5.000 años. También 
surgió, de manera independiente, algo más tarde en Egipto y en China. Aunque partían de 
dibujos para representar las palabras, los dibujos se fueron estilizando cada vez más, con lo 
cual recordaban cada vez menos el concepto original. La razón de estos cambios es muy 
sencilla: la escritura se hacía entonces con punzones o estiletes en forma de cuña sobre la roca 
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O la arcilla y era, por lo tanto, un proceso lento y trabajoso. Fue para conseguir mayor rapidez 
por lo que los escribas fueron simplificando los dibujos. Al mismo tiempo se fueron haciendo 
más arbitrarios, por lo que finalmente sólo los propios escribas eran capaces de hacer las 
inscripciones y de interpretarlas. En concreto, los súmenos, por el año 3000 a.C, crearon 
docenas de signos cuneiformes a partir de los pictogramas que eran tan estilizados que sólo 
ellos podían entender. Asimismo, el sistema jeroglífico egipcio utilizaba pictogramas tan 
estilizados que sólo sus especialistas eran capaces de leer. 

Los chinos siguieron un proceso similar, aunque más tarde en el tiempo, en torno al año 1000 
a.C. En sus primeras inscripciones sobre huesos o conchas hacían caracteres bastante 
parecidos a los objetos que representaban, pero pronto también se fueron estilizando, por lo 
que se fue haciendo imposible reconocerlos directamente. Se estima que solo el 2% de los 
caracteres chinos actuales contiene pictogramas reconocibles (Dehaene, 2009). 

Un nuevo avance importante realizado por los sumerios fue asociar los caracteres a sonidos en 
lugar de a significados, es decir, utilizar los pictogramas para representar sílabas, un signo 
cuneiforme para cada sílaba. Así, el signo de una planta pronunciada «mu» sirvió para 
representar la sílaba «mu» independientemente de la palabra a la que perteneciese, o el 
pictograma de una flecha pronunciada «ti» para representar esa sílaba. De esta manera, los 
sumerios empezaron a designar caracteres para todas sus sílabas. Se estima que llegaron a 
utilizar en torno a 900 caracteres. No obstante, seguían además utilizando simultáneamente 
los pictogramas, con lo cual su escritura era una mezcla de dos sistemas, uno para los sonidos 
y otro para los significados, lo cual resultaba un tanto ambiguo. Este procedimiento de utilizar 
los dos sistemas a la vez no fue algo específico de los sumerios, también lo hicieron los 
egipcios y los chinos. La razón es que los pictogramas son mas intuitivos pero requieren un 
largo aprendizaje y una gran capacidad de memoria hasta llegar a conocer las 30.000 o 40.000 
palabras que maneja una persona media. Por el contrario, hay menos sílabas, pero son más 
abstractas. 

Hacia el año 1500 a.C. se produjo otro avance importante en la escritura: el paso de la sílaba al 
fonema o, lo que es lo mismo, la aparición de los sistemas alfabéticos: los signos pasaron a 
representar fonemas. Las primeras huellas del sistema alfabético se encontraron en la 
península del Sinaí correspondientes al año 1700 a.C. En un primer momento los escribas 
utilizaron algunos caracteres tomados del sistema jeroglífico y cuneiforme, pero para 
representar los sonidos, en concreto, las consonantes. Posteriormente inventaron nuevos 
signos a partir de pictogramas de palabras que comenzasen por esos sonidos. Así, el sonido 
«b» se tomó de la forma de una casa llamada «beth», y el sonido «m» de la palabra «mem» 
que significaba «olas» (Dehaene, 2009). 

Posteriormente, los fenicios transformaron esos dibujos en formas mucho más estilizadas con 
sólo unos pocos rasgos, ya muy similares a las letras actuales. Además, introdujeron algunas 
vocales a partir de determinadas consonantes: la «u» de la «w», la «i» de la «j», etcétera. 
Finalmente, fueron los griegos los que terminaron de incluir todas las vocales y estilizaron 
aún más las letras para crear el sistema alfabético casi como lo conocemos hoy. Los últimos 
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cambios fueron realizados por los romanos a partir del alfabeto griego. 

En definitiva, la escritura siguió un largo camino desde las primeras manifestaciones 
ideográficas aparecidas en las cuevas hasta las formas que utilizamos actualmente. La mayor 
parte de ese camino lo realizaron los sumerios, egipcios, fenicios y griegos. El paso de la 
palabra a la sílaba y, finalmente, al fonema fue un proceso largo, y algunos sistemas se han 
quedado en esos estadios intermedios. Así, el chino y el kanji japonés siguen siendo 
logográficos, y el kana japonés y el hangul coreano son silábicos. 


Todos los días pasamos buena parte del tiempo leyendo periódicos, revistas, libros, teletextos 
o mensajes que nos llegan al teléfono y al ordenador. Es indudable que las personas 
analfabetas se encuentran en una gran desventaja en la sociedad desarrollada. 

Al no estar programado en el cerebro, el lenguaje escrito requiere un aprendizaje sistemático 
de varios años hasta conseguir leer de una manera fluida y automática, pero, una vez 
adquirido, ya no podemos parar de leer. Cada vez que una palabra o frase aparece ante nuestros 
ojos no podemos evitar leerla. En consecuencia, la lectura se ha convertido, junto con la 
comprensión oral, en un tema central de la psicología del lenguaje. 

La lectura requiere unos procesos similares a los que empleamos en el lenguaje oral, ya que el 
objetivo que persigue es el mismo: comprender un mensaje a partir de unos estímulos físicos 
que llegan a nuestros sentidos. La diferencia radica en que en el lenguaje oral esos estímulos 
son ondas sonoras que llegan a nuestros oídos, y en el lenguaje escrito, son signos en el papel o 
en la pantalla que se proyectan sobre nuestros ojos. Así pues, hay diferencias importantes entre 
ambas modalidades del lenguaje, al menos a nivel perceptivo. De hecho, mientras que en el 
lenguaje oral los fonemas que forman las palabras van llegando a nuestros oídos de manera 
sucesiva y desparecen inmediatamente, en el lenguaje escrito las letras que forman las palabras 
aparecen todas a la vez y permanecen en nuestro campo visual durante todo el tiempo que 
queramos, lo que nos permite volver a leer una palabra si no estamos seguros de haberlo hecho 
bien. 

A partir de los fonemas en el lenguaje oral y de las letras en el lenguaje escrito reconocemos 
las palabras, algo fundamental para entender el mensaje. Pero también en este nivel se 
producen diferencias entre ambos tipos de lenguaje. Justamente por ese factor de 
secuenciación temporal que acabamos de mencionar, las variables determinantes del 
reconocimiento de palabras en una y otra modalidad son distintas. En el lenguaje oral, la 
variable más determinante de la rapidez en el reconocimiento de las palabras es el punto de 
unicidad, como se vio en el capítulo 5, pues cuanto antes se diferencie una palabra del resto, 
antes se reconoce. En cambio, en la lectura, la palabra aparece completa ante nuestra vista, por 
lo que el punto de unicidad tiene poca importancia, y menos aun en los lectores expertos que 
identifican todas las letras en paralelo. En el reconocimiento de palabras escritas, las variables 
más influyentes son la frecuencia de uso y la edad de adquisición. Como consecuencia de estas 
diferencias se han propuesto modelos específicos para el reconocimiento de las palabras 
escritas diferentes a los que explican el reconocimiento de las palabras habladas. 
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Igualmente existen diferencias en la comprensión de oraciones y textos. Así, la prosodia y los 
gestos del hablante son componentes importantes en la comprensión oral, aparte de que 
hablante y oyente están haciendo referencia constantemente al contexto. En el lenguaje escrito, 
el lector tiene que interpretar la prosodia a través de los signos de puntuación y construir el 
contexto, sobre la base de hacer muchas inferencias acerca de lo que aparece en el texto y de 
aportar mucha información de sus propios conocimientos. Este punto ya ha sido tratado en el 
capítulo 9. 

Por lo tanto, en este capítulo se describirán los procesos de la lectura que, aun siendo paralelos 
a los del lenguaje oral, tienen sus peculiaridades y sus modelos específicos. En primer lugar se 
tratarán los procesos perceptivos que realizamos durante la lectura para poder identificar las 
letras que aparecen ante nuestros ojos y a continuación los procesos de reconocimiento de 
palabras escritas. Finalmente, se describirán las bases neurológicas de la lectura. 


PERCEPCIÓN DE LA INFORMACIÓN ESCRITA 
A lo largo de toda la evolución el único lenguaje utilizado por la especie humana ha sido el 
oral, que es percibido a través de los oídos. El lenguaje escrito es una adquisición reciente, por 
lo que todavía no ha transcurrido tiempo suficiente para que pueda programarse en nuestros 
cerebros. Eso significa que tenemos que utilizar mecanismos cerebrales que estaban 
destinados a otras actividades, como el reconocimiento de los objetos y las caras, para poder 
leer. Como dice Dehaene (2009), «disfrutamos de la lectura de Nabokov y Shakespeare 
usando un cerebro de primate diseñado originalmente para vivir en la sabana africana» 
(Reading in the brain, pág. 4). 

e Movimientos sacádicos y fijaciones 
Cuando leemos, colocamos el texto frente a nuestros ojos, pero aunque nuestro campo visual 
es muy amplio, ya que abarca casi 180%, realmente nuestra agudeza visual se limita a una 
franja muy pequeña, la zona de la fóvea en el centro de la retina. Esta zona ocupa sólo 3*, lo 
cual significa que únicamente podemos ver unas 10 o 12 letras, es decir, dos palabras cortas (p. 
ej., «hace tiempo») o una palabra larga («universidad»). Para poder ver las siguientes palabras 
nuestros ojos tienen que desplazarse a una nueva posición, pero no lo hacen de una manera 
suave y progresiva, sino mediante saltos bruscos denominados movimientos sacádicos. 
Gracias a estos saltos vamos situando las siguientes partes del texto dentro de nuestro campo 
foveal para ir así procesándolo (Cuetos, 2008). 
En definitiva, cuando leemos, nuestros ojos se fijan en una zona del texto -generalmente se 
comienza por la parte de arriba a la izquierda- para procesar la información de la primera o las 
primeras dos palabras (dependiendo de la longitud) y a continuación realizan un movimiento 
sacádico que los sitúan un poco más a la derecha para procesar las palabras siguientes. Nueva 
fijación y nuevo movimiento sacádico hasta llegar al extremo derecho de la página. En ese 
momento nuestros ojos producen un salto hacia atrás, al inicio de la segunda línea para 
detenerse en la primera o las primeras palabras y continuar después avanzando a lo largo de la 
frase. Ese proceso se repite a lo largo de todas las líneas del texto. 
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Durante los períodos de fijación extraemos la información de las palabras y accedemos a su 
significado y pronunciación, y durante los movimientos sacádicos desplazamos nuestra 
atención a la siguiente parte del texto. Los períodos de fijación dependen mucho del lector y 
del tipo de texto, pero el promedio es de unos 200 o 250 ms. Si el lector es experto, el tiempo es 
menor, pero si se trata de un aprendiz o de una persona con problemas lectores (p. ej., los niños 
disléxicos), los tiempos de fijación son mayores. También los textos influyen; así, con textos 
difíciles, textos formados por palabras de baja frecuencia o textos importantes, los períodos de 
fijación son mayores. El comienzo de un nuevo tema también supone un incremento en los 
tiempos de fijación. 

En cuanto a los movimientos sacádicos, el tiempo medio de duración es de unos 20 o 40 ms, 
aunque también presenta variaciones. La amplitud media de los desplazamientos es de unos 8 
o 10 caracteres (contando letras y separaciones entre letras), aunque también existe una gran 
variabilidad en los saltos sacádicos. Rayner y McConkie, probablemente las personas que más 
han investigado sobre los movimientos oculares durante la lectura, han encontrado saltos de 
sólo dos caracteres y saltos de hasta 18 caracteres en sólo unas pocas líneas de separación. 
Como las fijaciones, los movimientos sacádicos están determinados por las variables del texto 
(complejidad, longitud de las palabras, frecuencia, etc.) y de las características del lector. Pero, 
por término medio, durante la lectura, nuestros ojos pasan el 90 % del tiempo percibiendo las 
palabras y el 10 % cambiando hacia nueva información (Rayner y McConkie, 1976). 

En ocasiones, en vez de hacia adelante, los saltos se dirigen hacia atrás, hacia una zona del 
texto que ya se ha leído. Esto sucede cuando el lector no está entendiendo el texto y tiene que 
volver a leerlo, por lo que las regresiones son más abundantes en los textos complejos que en 
las lecturas sencillas. También son más abundantes en los lectores con dificultades que en los 
expertos; así, se ha comprobado que los niños disléxicos realizan muchas regresiones. 
Normalmente las regresiones suelen ser cortas y dirigirse a zonas próximas, pero a veces se 
producen saltos que llegan varias líneas atrás (Just y Carpenter, 1987). 

Una característica importante de los movimientos sacádicos es que son de naturaleza balística, 
lo cual significa que una vez que inician un movimiento, ya no es posible corregirlos. En 
consecuencia, la elección del próximo punto de fijación tiene que ser realizada antes de iniciar 
el movimiento. ¿Cómo se decide entonces donde deben aterrizar los ojos para iniciar la 
siguiente fijación? McConkie y Rayner (1976) demostraron que, durante una fijación, el lector 
se sirve de la información parafoveal distante, es decir, la información borrosa que percibe por 
el «rabillo del ojo», para decidir el lugar del texto adonde dará el salto para la próxima fijación. 
Esta información parafoveal no es suficiente para reconocer las palabras, por lo que no puede 
informar sobre qué palabras son más importantes y deben atraer la atención del lector, pero sí 
es útil para conseguir información superficial que ayuda a decidir qué parte de la frase puede 
ser clave. Así, por ejemplo, por la zona parafoveal se extrae información sobre la longitud de 
las palabras, al percibir los espacios entre las palabras. Sabemos que la información relevante 
se encuentra en las palabras de contenido y que éstas son más largas que las funcionales; así 
pues, nuestros ojos se dirigen hacia las palabras largas y se saltan las palabras cortas 
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funcionales (por esta razón es tan difícil darse cuenta de que hay un error tipográfico cuando se 
trata de una palabra funcional corta). Por otra parte, en la propia fijación hay un sesgo hacia la 
derecha, debido a que la lectura va de izquierda a derecha, al menos en nuestro sistema 
alfabético, de modo que nuestros ojos van buscando información hacia la derecha. Por eso, de 
las 10 o 12 letras, aproximadamente, que fijan nuestros ojos, no hay 5 o 6 para cada lado, sino 
3 0 4 hacia la izquierda y 7 u 8 hacia la derecha. Estas estrategias de decisión sobre la dirección 
de los movimientos sacádicos tienen gran importancia para una lectura eficiente y se adquieren 
y perfeccionan con la práctica, por eso hay grandes diferencias entre los buenos y malos 
lectores. 

En el momento en que los ojos se detienen en una parte del texto, comienza la extracción de la 
información del texto (Recuadro 11-2). 


Recuadro 11-2. Fóvea dividida 


Nuestro campo visual se divide en mitades simétricas: la mitad izquierda se proyecta en el 
hemisferio derecho, y la mitad derecha, en el hemisferio izquierdo. De esta manera, dependiendo 
de dónde se encuentren situados los estímulos que aparecen en nuestro campo visual, serán 
proyectados sobre uno u otro hemisferio. No obstante, las informaciones de ambos hemisferios 
se conectan rápidamente entre sí a través del cuerpo calloso. Esto significa que cuando vemos un 
objeto o una escena, la mitad izquierda será analizada por el hemisferio derecho, y la mitad de- 
recha por el hemisferio izquierdo, y luego el cerebro tendrá que unir ambas mitades para formar 
la representación total del objeto. Lo mismo sucederá cuando vemos una palabra (p. ej., fijación), 
pues si colocamos el punto de fijación en el centro, la mitad izquierda («fijan) se proyectará en el 
hemisferio derecho y la otra mitad («ción») en el izquierdo: «fija ción» (Fig. 11-1). 


Hasta hace poco se pensaba que esta división sólo se 
producía en la periferia de los campos visuales y que no 
afectaba a la fóvea, la zona central de la retina y de máxi- 
ma agudeza visual. Según la teoria clásica de proyección 
bilateral, los estimulos que caen en la zona de la fóvea se 
proyectan simultáneamente sobre ambos hemisferios. Por 
lo tanto, las palabras se proyectarian de forma completa 
sobre ambos hemisferios, evitando así esa división. 


FIJACIÓN 


En los últimos años, sin embargo, se han publicado di- 
versos estudios empíricos que parecen demostrar que tam- 
bién en la fóvea se produce esa división en los dos campos 
visuales. Esta nueva teoría, denominada fóvea dividida, 
sostiene que los estímulos que se proyectan en la fóvea 
van divididos hacia el hemisferio correspondiente (Shillcock 
y Monaghan, 2001). En consecuencia, cuando leemos una 
palabra, las letras que aparecen a la izquierda del punto de 
fijación se proyectarán sobre el hemisferio derecho, y las 
letras que aparecen a la derecha de dicho punto lo harán 
sobre el hemisferio izquierdo. Posteriormente, la informa- 
ción fluye por el cuerpo calloso para unir las dos mitades en una sola palabra. Algunos autores 
sostienen que la transferencia entre los dos hemisferios se produce en ambas direcciones, de ma- 
nera que ambos hemisferios consiguen la representación completa de la palabra. Otros, en cambio, 
sostienen que la transferencia es asimétrica y que va sólo del hemisferio derecho al hemisferio 
izquierdo, que es el hemisferio del lenguaje y donde se realiza el procesamiento de las palabras. 


Figura 11-1. Proyección de cada mi- 
tad de la palabra a cada hemisferio. 


También es posible que en cada fijación se proyecte suficiente información de la palabra en 
el hemisferio izquierdo como para que éste pueda procesarla directamente. Como se describió al 
hablar de los movimientos oculares, en cada salto sacádico los ojos suelen aterrizar en el inicio 
de la palabra, es decir, el punto de fijación se sitúa en las primeras letras de la palabra. Esto sig- 
nifica que la mayor parte de las letras de la palabra quedan a la derecha del punto de fijación y 
que, por lo tanto, se proyectan sobre el hemisferio izquierdo, el cual con esas letras podría tener 
suficiente información para procesar la palabra sin tener que esperar a la información que llega 
del hemisferio derecho a través del cuerpo calloso. 


Obviamente, esto sucede con las personas -que son la mayoría- cuyo lenguaje depende del 
hemisferio izquierdo. Pero ¿qué ocurre con ese pequeño porcentaje de personas en las que es 
el hemisferio derecho el responsable del lenguaje? En este caso, lo lógico sería que tratasen de 
colocar el punto de fijación en la parte final de las palabras para que la mayor parte de las letras 
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quedasen a la izquierda del punto de fijación y fuesen, por consiguiente, proyectadas sobre el he- 
misferio derecho. Hunte, Brysbaert y Knecht (2007) comprobaron que así sucedía. Seleccionaron 
a dos grupos de individuos, uno con lateralización del lenguaje en el hemisferio izquierdo y otro 
en el derecho. Para comprobar la lateralización median la activación cerebral de los participan- 
tes mediante resonancia magnética funcional mientras realizaban tareas lingúísticas. Después 
presentaban palabras de cuatro letras para que los sujetos las leyesen en voz alta lo más rápido 
posible. Las palabras eran presentadas de manera que el punto de fijación podía caer sobre cada 
una de las letras. Comprobaron que los individuos cuyo lenguaje dependía del hemisferio izquier- 
do eran más rápidos en nombrar la palabra cuando el punto de fijación caía sobre la primera letra 
y, por lo tanto, el resto de la palabra se proyectaba sobre el hemisferio izquierdo, mientras que los 
participantes cuyo lenguaje dependía del hemisferio derecho eran más rápidos cuando el punto 
de fijación caía sobre las ultimas letras. 


Pero no todo el tiempo de la fijación se dedica al análisis visual de las palabras, de hecho, este 
análisis requiere muy poco tiempo. Rayner et al. (1981) comprobaron que de los 200-250 ms 
que normalmente dura cada fijación, la extracción de la información visual sólo requiere de los 
primeros 50 ms. En un experimento presentaban frases para que los participantes las leyesen y, 
cuando llevaban un pequeño tiempo de fijación, interponían un estímulo que impedía seguir 
leyendo. Cuando la interposición se producía antes de los primeros 50 ms, los sujetos no eran 
capaces de leer la información que tenían delante de sus ojos, pero si se producía pasado ese 
tiempo la leían sin dificultad. Entonces, si sólo necesitamos 50 ms, ¿por qué continúan 
nuestros ojos parados sobre esa parte del texto? ¿Qué hacen los 200 ms restantes? La respuesta 
es que el sistema cognitivo necesita un tiempo para procesar esas palabras, es decir, para 
acceder a su significado y a su pronunciación, y mientras no termina de hacer ese trabajo no 
recoge más información. De manera que los ojos sólo se mueven cuando se termina de 
procesar la información. Por esa razón, al final de las frases las fijaciones duran más, porque se 
está procesando la frase completa. Esta coordinación ojo-mente es la que marca la velocidad 
lectora y la que hace que nuestros ojos no puedan avanzar más rápido de lo que la mente les 
permite, si queremos tener una lectura comprensiva del texto. Por eso, los métodos de lectura 
que anuncian el aumento de la velocidad lectora, moviendo los ojos de manera más rápida, lo 
que consiguen ganar en velocidad lo pierden en comprensión. 
e Identificación de las letras 

Una de las primeras tareas que nuestro sistema lector realiza en los milisegundos que dura la 
fijación es la identificación de las letras. Si no conseguimos identificar las letras (como ocurre 
cuando intentamos leer una receta médica) no podemos seguir con el proceso de 
reconocimiento de las palabras escritas. En los años setenta del siglo pasado se planteó la 
hipótesis de plantillas para explicar el reconocimiento de letras. Según esta hipótesis, los 
lectores disponemos de representaciones con las formas de cada letra, una especie de plantillas 
con las que vamos comparando las letras que vemos escritas. Así, cuando vemos la letra «e» 
comprobamos con cuál de las plantillas encaja y, en cuanto se produce el solapamiento, se 
reconoce como esa letra. Esta hipótesis es intuitiva, pero tiene el inconveniente de que no nos 
bastan 27 plantillas -una para cada letra-, ya que las letras pueden escribirse de maneras muy 
diferentes, en mayúscula, minúscula, script, cursiva, etc. (f, E, f, F, F, etc.), por lo que 
necesitaríamos multitud de plantillas para poder reconocer cada una de las letras. Por otra 
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parte, este sistema de plantillas no encaja con el funcionamiento cerebral responsable de la 
lectura (Cuetos, 2008). 
De ahí que actualmente tenga más defensores la hipótesis de rasgos, según la cual cada letra se 
define por una serie de rasgos, de manera que, cuando el sistema detecta determinados rasgos, 
deduce de qué letra se trata. Así, por ejemplo, la detección de los rasgos línea vertical y dos 
líneas horizontales, una arriba y otra en el medio lleva a la letra «f», línea vertical y punto 
arriba a la letra «i», etc. Esta teoría es más económica porque con unos cuantos rasgos se 
definen todas las letras y se pueden reconocer con independencia del estilo con el que estén 
escritas. Sólo es necesario que cuenten con los rasgos definitorios que caracterizan a Cada 
letra. Por otra parte, esta hipótesis se ajusta mejor al funcionamiento cerebral, ya que nuestro 
sistema visual cuenta con unos detectores de rasgos (células simples y complejas en el área 
visual primaria) que se activan ante estos rasgos que definen las letras (línea, vertical, línea 
horizontal, línea inclinada, círculo, etc.). 
Una vez que nuestro sistema lector identifica una letra, se olvida pronto de cuáles fueron los 
rasgos que permitieron su identificación, es decir, si la letra estaba en mayúscula, en 
minúscula, en script, etc., o incluso si estaba incompleta y le faltaba algún rasgo, ya que lo que 
se conserva es una representación abstracta de la letra. En un famoso experimento, McConkie 
y Zola (1979) presentaban oraciones en una pantalla en las que las palabras tenían las letras 
alternadas entre mayúsculas y minúsculas: 
«LaStRoPaSeNeMiGaSaVaNzAbAnAgRaNvElOeldAd...» 
Cuando los sujetos realizaban los movimientos sacádicos correspondientes, cambiaban los 
tipos de letras, de modo que las que estaban en mayúscula pasaban a minúscula y viceversa: 
«lAsTrOpAsEnEmlgAsAvAnZaBaNaGrAnVeLoCiDaD...» 
Los investigadores comprobaron que esos cambios no producían en los sujetos dificultad 
adicional alguna durante la lectura, ya que la duración de las fijaciones y la longitud de los 
movimientos sacádicos no eran diferentes a la condición en la que se conservaba el mismo tipo 
de letra. 
Actualmente hay pocas dudas de que la identificación de las letras que componen las palabras 
es un paso previo y necesario para su reconocimiento, pues los datos empíricos son claros. Sin 
embargo, durante años dominó la hipótesis de que la forma global de las palabras era 
suficiente para su reconocimiento. El origen de esta hipótesis global se remonta a los trabajos 
pioneros de Cattell de finales del siglo xix sobre reconocimiento de palabras presentadas 
durante un tiempo breve en el taquistoscopio, un aparato que permitía presentar estímulos 
visuales de forma breve y controlada y que, hasta la década de los setenta, era habitual en los 
laboratorios de psicología. Cattell comprobó que los sujetos tenían más dificultades para 
identificar letras cuando se presentaban aisladas que cuando formaban parte de una palabra. 
Estos resultados fueron apoyados también en esa época por Pillsbury con otra metodología 
diferente. Pillsbury presentaba a sus participantes durante un breve tiempo palabras que tenían 
una letra borrosa por llevar encima una «x» para que las identificasen. A pesar de la «x», los 
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individuos identificaban perfectamente las palabras y además, la mayor parte de las veces no 
eran conscientes de la existencia de la «x» (Cuetos, 2008). 

Aunque estos primeros experimentos tuvieron un gran mérito, presentaban algunos problemas 
metodológicos importantes. Uno de ellos es que, en las presentaciones taquistoscópicas, los 
sujetos, más que reconocer las palabras, muchas veces las adivinan. Con un poco de 
información que perciban de la palabra pueden llegar a adivinar el resto. Para evitar este 
problema Reicher (1969) propuso un nuevo paradigma en el que también presentaba palabras 
durante una breve exposición, pero la tarea de los participantes era decidir entre dos letras que 
se presentaban a continuación si una de ellas aparecía en una posición determinada de la 
palabra anterior. Pero esas dos letras se seleccionaban cuidando que no pudieran ser 
adivinadas. Por ejemplo, si se presentaba la palabra «abril», las letras sobre las que los sujetos 
tenían que responder eran «r» y «1» en la última posición, dado que en ambos casos se forma 
una palabra (abril/abrir), por lo que no queda espacio a la adivinación. La ejecución en esta 
condición se comparaba con otra en la que se presentaban varias letras de manera aleatoria (p. 
ej., «airbl»). Aun con este control experimental los resultados siguieron siendo mejores para 
las palabras que para la serie de letras, lo que seguía apoyando el denominado «efecto de 
superioridad de las palabras». 

Con diferentes metodologías, otros investigadores también obtuvieron resultados que parecían 
apoyar la hipótesis global. Así, Johnson, en los años setenta, utilizó una tarea en la que los 
participantes tenían que emparejar letras aisladas o palabras completas (Johnson, 1975). Los 
sujetos tardaban aproximadamente el mismo tiempo para decidir que una palabra era igual a 
otra presentada previamente que para decidir que una letra era igual a otra también presentada 
previamente. Por consiguiente, también concluyó que no es necesario identificar las letras para 
reconocer las palabras. 

Estos resultados experimentales tuvieron importantes implicaciones, tanto en el plano teórico 
para la construcción de los modelos de lectura, como en el plano educativo sobre los métodos 
de enseñanza de la lectura. Durante las décadas de los setenta y los ochenta del siglo XX 
tuvieron gran influencia los métodos globales que enseñaban a leer a partir de la palabra 
completa, más que de la letra o la sílaba. Si el reconocimiento de las palabras se hace de 
manera global, parece lógico que se enseñe a leer mediante palabras completas y no partes de 
la palabra. Sin embargo, investigaciones posteriores con experimentos muy controlados desde 
el punto de vista metodológico mostraron que no es posible reconocer las palabras si no se 
identifican previamente las letras componentes y que los resultados sobre el efecto de 
superioridad de las palabras no eran más que artefactos experimentales. Por ejemplo, en los 
experimentos de Johnson los resultados dependen fundamentalmente del tipo de palabras y de 
distractores utilizados. Si el par de palabras que se presentan en la condición diferente son muy 
distintas (p. ej., casa-árbol), ciertamente puede ser más rápido responder a palabras que a 
letras, pero si son similares (p. ej., casa-cara), los tiempos para responder a las palabras son 
mucho mayores que para responder a las letras. Además, esta hipótesis del reconocimiento 
global no tiene una respuesta clara a la pregunta de qué es exactamente lo que nos permite 
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reconocer las palabras, si no son las letras individuales. ¿Es acaso su contorno o perfil? Parece 
poco probable que sean los perfiles, ya que tenemos que reconocer miles de palabras diferentes 
por lo que necesitaríamos disponer de miles de perfiles distintos. Por otra parte, si usásemos 
los perfiles y no identificásemos cada una de las letras sería muy fácil confundirse con palabras 
similares que tienen perfiles casi idénticos (p. ej., «pata» y «pala», «elefante» y «elegante»). 
Parece mucho más seguro y económico identificar previamente las letras, pues basta con dis- 
poner de representaciones para las 27 letras para poder reconocer cualquier palabra. Los datos 
acumulados en los últimos años no dejan duda sobre la necesidad de identificar previamente 
las letras para reconocer las palabras. De hecho, la mayoría de los modelos de lectura incluyen 
esa Operación como un paso previo y necesario. 


RECONOCIMIENTO DE PALABRAS ESCRITAS 

El reconocimiento de palabras es el proceso fundamental de la lectura, puesto que implica 
nada menos que extraer el significado y la pronunciación de los signos que hay escritos sobre 
el papel o la pantalla. Si falla este proceso, falla todo lo demás. Si una persona tiene 
dificultades en el reconocimiento de palabras, como ocurre con los disléxicos, se resiente todo 
el sistema lector, incluida la comprensión del texto. La importancia de este proceso ha sido 
puesta de manifiesto por muchos autores y queda demostrada por la enorme cantidad de 
investigaciones llevadas a cabo sobre este tema, pues sin duda es uno de los campos más 
investigados, no sólo de la psicología del lenguaje, sino incluso de la neurociencia cognitiva. 
Algo que sorprende enormemente es la rapidez con que reconocemos las palabras escritas. En 
cuanto vemos una palabra ante nuestros ojos nos da la sensación de que instantáneamente 
recuperamos su significado y su pronunciación. Lo cierto es que no es tan instantáneo, pues 
requiere unos cientos de milisegundos, pero no deja de ser un tiempo muy breve para algo tan 
complejo como es reconocer una palabra entre las miles de palabras que tenemos en nuestro 
léxico. El proceso de reconocimiento de palabras escritas mejora con el aprendizaje, puesto 
que la lectura, al contrario que el lenguaje oral, requiere una enseñanza sistemática y 
continuada en el tiempo, de manera que en los primeros años los niños tardan varios segundos 
en acceder al significado y a la pronunciación de las palabras escritas, pero a medida que van 
adquiriendo fluidez los procesos se automatizan y los tiempos se acortan, hasta el punto que 
los lectores expertos no pueden evitar leer las palabras que aparecen en su campo visual, 
incluso aunque intenten no leerlas. 

Justamente, uno de los efectos más famosos de la psicología es el efecto Stroop, que consiste 
en presentar palabras escritas con distintos colores de tinta para que los sujetos digan el color 
en el que están escritas las palabras. Cuando esas palabras corresponden a colores y están 
escritos con tintas diferentes (p. ej., la palabra «rojo» escrita en «amarillo») los individuos 
tienen muchas dificultades para decir «amarillo» porque no pueden evitar leer «rojo». 

Se han utilizado muchas metodologías diferentes para investigar los procesos de 
reconocimiento de las palabras escritas, principalmente basadas en los tiempos de reacción, 
aunque también en los tiempos de exposición y de seguimiento de los movimientos oculares y 
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las técnicas electrofisiológicas. Con estas metodologías se han podido secuenciar los procesos 
que intervienen en el reconocimiento de palabras y conocer las variables que determinan su 
velocidad de procesamiento. Así, sabemos que la frecuencia con la que aparecen escritas las 
palabras es una variable determinante de los tiempos de reconocimiento. De esta manera, 
palabras aparentemente similares, como «persona» y «pestaña», que de forma intuitiva parece 
que reconoceríamos en ambos casos de manera instantánea, cuando se miden los tiempos de 
reacción se comprueba que la mayoría de los participantes tardan unos milisegundos menos en 
reconocer la palabra «persona» porque tiene una mayor frecuencia de uso. Hay otras muchas 
variables, como la longitud, la complejidad silábica, etc., que también influyen en los tiempos 
de reconocimiento. Para explicar estos datos se han propuesto diferentes modelos y teorías. En 
este apartado describiremos las metodologías más utilizadas, los resultados más relevantes 
obtenidos con ellas y los principales modelos de reconocimiento de palabras. 

e Metodología 
En el capítulo 6 se han descrito diversas técnicas experimentales para investigar los procesos 
de reconocimiento de palabras habladas. Para el reconocimiento de las palabras escritas 
contamos también con un amplio número de técnicas. Algunas de ellas son similares en ambos 
ámbitos, mientras que otras son específicas de la lectura. A continuación se describirán las más 
utilizadas. 
Umbral de reconocimiento. Consiste en la identificación de palabras que se presentan de 
forma muy breve en una pantalla. Es la tarea más tradicional de todas y su uso se inició en el 
siglo XIX. Entonces se utilizaba el instrumento rey de la psicología experimental, el 
taquistoscopio (Fig. 11-2). 


Hoy esta metodología se aplica a través de los 
ordenadores, que, además de su versatilidad en la 
presentación de los estímulos, tienen la ventaja de 
registrar las respuestas. 
En la práctica, se empieza presentando cada palabra con 
tiempos muy cortos y progresivamente se van alargando 
hasta que el sujeto es capaz de identificarla. Se obtiene, 
así, el umbral de reconocimiento, en cuyo caso, la 
A a aosORo de Un SmPo variable dependiente corresponde a los milisegundos de 
exposición del estímulo necesario para su correcta 
identificación. Otra posibilidad es emplear un tiempo fijo y obtener como variable dependiente 
el porcentaje de aciertos. Las variables independientes pueden ser muy diversas, dependiendo 
del objetivo de cada experimento. Así, si se desea averiguar si se identifican mejor las palabras 
cortas que las largas, se usará como variable independiente la longitud de las palabras, 
seleccionando estímulos cortos y largos para comparar los resultados. Un inconveniente 
general del método de identificación es que no obliga al sujeto a responder de forma rápida, lo 
cual puede permitir la intervención de otro tipo de procesos posléxicos (estrategias de 
adivinación, etc.) distintos de los que se pretenden estudiar. 
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Decisión léxica visual. Es similar a la decisión léxica auditiva explicada en el capítulo 6, con 
la diferencia de que en este caso se presentan los estímulos en forma escrita. El participante 
debe decidir lo más rápidamente posible si una serie de letras es, o no, una palabra de su 
idioma pulsando uno de dos botones o teclas. La mitad de los estímulos suelen ser palabras y la 
otra mitad no-palabras. Dependiendo de lo que se esté investigando, las no-palabras pueden 
estar formadas por series de letras (p. ej., «mrfacpj») o pueden ser seudopalabras, es decir, 
series de letras que resultan pronunciables al igual que las palabras (p. ej., «marjoto»). La 
decisión léxica visual fue usada antes que la auditiva, y la emplearon por primera vez 
Ru-benstein, Garfield, y Millikanen en 1970. Sigue siendo la tarea más utilizada para 
investigar el reconocimiento visual de palabras, ya que permite manipular de una manera fácil 
las características de las palabras (longitud, frecuencia, complejidad morfológica, etc.) y 
recoger los efectos sobre los tiempos de respuesta, es decir, el tiempo que transcurre desde que 
aparece el estímulo en la pantalla hasta que el sujeto pulsa una de las teclas (Fig. 11-3). 

Lectura en voz alta. En esta tarea no hace falta tomar 


una decisión sobre el estímulo. Simplemente se 
e 2 presentan palabras en la pantalla del ordenador para que 
sÍ NO (5) 


el participante las pronuncie en voz alta, lo más rápido 

E n posible. De nuevo, la variable dependiente es el tiempo 
de reacción que transcurre desde la presentación del 12 
Figura 11-3. Decisión léxica: una de la tareas expr estímulo hasta el inicio de la respuesta vocal. Su registro 


mentales más usadas en el estudio del reconocimiento 
de palabras. Ante la presentación de cada estímulo, el lo realiza el ordenador gracias a una llave vocal, 


participante debe pulsar lo más rápido posible uno de 

dos botones: si (palabra) o o (no-palabra). dispositivo que se activa ante la llegada de la voz. El 
tiempo medio de lectura de las palabras se sitúa en torno a los 500 ms (Cuetos y Barbón, 2006). 
Es importante no olvidar que el tiempo registrado llega sólo hasta el inicio de la respuesta; no 
se incluye, por lo tanto, el tiempo que consume la propia pronunciación, el cual refleja otros 
factores que son distintos del acceso léxico (la longitud y «pronunciabilidad» del estímulo, la 
velocidad neuromotora del individuo, etc.). El supuesto básico que subyace a esta técnica es 
que el tiempo necesario para iniciar la pronunciación de una palabra depende de su 
accesibilidad o disponibilidad en el léxico mental. Cuanto más accesible es la unidad léxica, 
antes comenzará la respuesta verbal. 
Categorización semántica. En la tarea de categorización semántica se presentan palabras 
pertenecientes a dos categorías diferentes (p. ej., animales domésticos frente a animales 
salvajes) para que los individuos respondan pulsando uno de dos botones o teclas a cuál de las 
dos categorías pertenecen. Esta tarea mide el acceso al sistema semántico, pues se supone que 
para responder a qué categoría pertenece cada palabra el sujeto tiene que acceder a su 
significado. De hecho, en esta tarea influyen algunas variables denominadas semánticas, como 
la tipicidad (lo representativo que es un estímulo de su categoría) o la imaginabilidad. Al igual 
que en la decisión léxica se mide el tiempo desde que se presenta la palabra hasta que el 
individuo responde pulsando una de las dos teclas. 
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Movimientos oculares. Esta técnica ha adquirido importancia para estudiar cómo reco- 
nocemos las palabras y para entender mejor cómo procesamos unidades mayores del lenguaje 
escrito. Hoy se dispone de varias técnicas, con aparatos cada vez más ligeros y portátiles. El 
mecanismo básico consiste en la emisión de un rayo de luz infrarroja al globo ocular, no vi- 
sible para el sujeto, y que resulta reflejado hacia un sistema de registro conectado a un ordena- 
dor. Los movimientos del ojo hacen variar el ángulo del rayo reflejado y, a través de cálculos 
matemáticos, el ordenador puede determinar el sitio de la pantalla que el lector está mirando en 
cada momento (Fig. 11-4). 
S Algunos experimentos más sofisticados no se limitan al 
simple seguimiento visual, sino que modifican, en 
tiempo real, el contenido de la pantalla dependiendo de 
la mirada del participante. En honor a la verdad hay que 
decir que, aunque el uso de esta técnica se ha extendido 
gracias al avance tecnológico contemporáneo, los 
primeros resultados ya se obtuvieron a principios del 
siglo xx, con ingeniosos instrumentos. De hecho, la 
técnica de la reflexión corneana fue inventada por 
Figura 11-4. Seguimiento de los movimientos ocu Raymond Dodge hacia 1900. 
e an de un aparato especia! teyetracke La información más relevante que proporciona esta 
posible seguir y registrar el movimiento de los ojos 
Pra Na, exploración visual técnica es el lugar y el tiempo de fijación. Se parte del 
supuesto de que cuanta más cantidad de procesamiento 
requiere una palabra, mayor será el tiempo de fijación sobre ella. Esta técnica tampoco exige 
decisiones conscientes, como en la tarea de decisión léxica, y su principal atractivo reside en 
su validez ecológica, es decir, en el hecho de que la situación de laboratorio es semejante a la 
situación natural de lectura de un texto. Su principal inconveniente surge, precisamente, de su 
ventaja, puesto que en la medida en que se trabaja con textos, es difícil deslindar, a partir de los 
datos, los procesos de acceso léxico de otros procesos de orden superior. Por otra parte, no hay 
que olvidar que durante una fijación se puede extraer información visual más allá de una 
palabra. 
Priming. La técnica de priming se utiliza para estudiar el curso temporal del reconocimiento 
de las palabras. Como ya se explicó en el capítulo 6, la técnica de priming consiste en la 
presentación de una palabra inmediatamente antes de la que el individuo tiene que reconocer, 
aunque en este caso las palabras se presentan de forma escrita. La palabra previa se denomina 
prime, y la que el individuo tiene que reconocer, target. Generalmente, el prime se presenta en 
letras minúsculas, y el target, en mayúsculas para que tape totalmente al prime. En función de 
la relación entre el prime y el target y del tiempo de separación entre ambos (SOA), los 
tiempos de respuesta varían considerablemente. 
Dependiendo de la relación entre prime y target se distinguen varios tipos de priming. El 
priming de repetición es aquel en el que se presenta la misma palabra como prime y target (p. 
ej., barco-BARCO). Los efectos de priming de repetición son muy potentes, posiblemente 
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porque se produce activación a todos los niveles: ortográfico, fonológico y semántico. No 
obstante, el efecto es mayor en las palabras de baja frecuencia que en las de alta frecuencia, de- 
bido a que estas últimas se activan enseguida sin necesidad de ayuda. Esta interacción se 
conoce con el nombre de atenuación por la frecuencia. En el priming ortográfico o formal, el 
prime y el target comparten muchas letras, por lo que tienen un gran parecido ortográfico (p. 
ej., carmero-CARTERO). En el priming fonológico el parecido entre prime y target es en la 
pronunciación. En castellano, priming fonológico y priming ortográfico son prácticamente 
indistinguibles porque las palabras que se pronuncian de forma parecida también se escriben 
de manera parecida, pero en inglés se pueden encontrar palabras que se pronuncian de manera 
parecida y se escriben de forma muy distinta, y a la inversa. Finalmente en el priming 
semántico prime y target están relacionadas con respecto a su significado (p. ej., 
perro-GATO). Hace ya años, en 1971, Meyer y Schvaneveldt comprobaron que cuando una 
palabra va precedida de otra con significado relacionado (p. ej., enfermera-DOCTOR), los 
tiempos de reconocimiento de la segunda disminuyen considerablemente. Desde entonces, 
numerosos experimentos con todas las técnicas (decisión léxica, lectura, etc.) han comprobado 
la robustez de este fenómeno (Fig. 11-5). 

En función del intervalo temporal entre el prime y el 


Hospital | | e target (SOA), se distinguen dos tipos de priming. 
5 Ly | controlado y automático. En el priming controlado el ] 4 

| intervalo temporal es superior a los 250 ms, por lo que 

DOCTOR | DOCTOR los individuos ven perfectamente el prime, aunque no 

A — ¡o tengan que responder ante él, sino sólo al target. En el 


Figura 1-5. Efecto de priming semántico: los tiem- prime automático la separación es inferior a los 250 ms, 
pos de reacción ante la palabra «Doctor» son signi- . . . 

ficativamente más cortos en la condición A que en la POT lo que los sujetos no tienen tiempo de llevar a cabo 
cocinas ninguna estrategia, y todos los efectos que se observen 
son producidos de manera automática. Hay incluso un tipo de priming, denominado 
enmascarado, en el que el prime se presenta durante un tiempo muy breve, en torno a los 50-75 
ms y, además, es inmediatamente tapado por una máscara de signos para dificultar su 
percepción. En estos casos los participantes no son conscientes de la presencia del prime, pero 
aun así se observan efectos importantes sobre los tiempos de reconocimiento. 

La técnica de priming es muy utilizada para investigar el curso del procesamiento léxico, es 
decir, en qué momento se reconoce la palabra, se accede a su fonología y a su significado, en 
función del momento en que se produce el priming ortográfico, fonológico o semántico. Así, 
se ha comprobado que el priming ortográfico ocurre en los primeros momentos del 
procesamiento; de hecho, sólo produce efectos facilitadores con SOA cortos, principalmente 
con el priming enmascarado. En cambio, el priming semántico se produce en momentos más 
avanzados y con cualquier intervalo. Esto significa que en los primeros milisegundos del 
procesamiento ya reconocemos las palabras, pero tardamos un poco más en acceder a su 
significado. 
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Potenciales evocados. La técnica de potenciales evocados mide la actividad eléctrica cerebral 
a través de unos electrodos colocados sobre el cuero cabelludo de los participantes. Ante los 
estímulos que aparecen en el campo visual del sujeto, el cerebro produce unas ondas que 
varían en polaridad y momento de aparición en función de sus características. Así, cuando una 
onda alcanza un pico máximo 200 ms después de presentado el estímulo y es de signo negativo 
se la denomina N200, y si alcanza el máximo a los 300 ms y es de signo positivo, P300. 
Algunas ondas se han asociado a determinados procesos, puesto que suelen aparecer cuando se 
realiza ese proceso; así, la onda N400 va asociada al procesamiento semántico, ya que siempre 
que se produce una anomalía semántica se genera esa onda, la N200 al procesamiento 
ortográfico y la N320 al procesamiento fonológico de las palabras. 
Los potenciales evocados son una técnica muy útil para obtener información sobre el curso 
temporal del reconocimiento de palabras porque proporciona datos sobre los cambios 
cerebrales milisegundo a milisegundo, es decir, tiene una gran resolución temporal (Fig. 11-6). 
De esta manera, si se comprueba que dos variables 
producen activación en diferentes momentos, puede 
concluirse que influyen en diferentes procesos del 
sistema. Por ejemplo, Hauk y Pullvermiúller (2004) 
estudiaron los efectos de la frecuencia y la longitud de 
las palabras en una tarea de decisión léxica y encontraron 
que la longitud influía en una fase más temprana, en 
torno a los 125 ms, mientras que la frecuencia lo hacía 
hacia los 200 ms. Por otra parte, Cuetos et al. (2009) 
investigaron la frecuencia y la edad de adquisición y 
Figura 11-6. Experimento de potenciales evocados. COmprobaron que la frecuencia producía cambios más 
tempranos que la edad de adquisición en una tarea de 
lectura silenciosa, por lo que concluyeron que estas dos variables tienen efectos 
independientes y sobre distintos procesos (efectos léxicos en el caso de la frecuencia y 
semánticos en el caso de la edad de adquisición). 


e Resultados 
A partir de estas metodologías se ha ido acumulando un importante cuerpo de conocimientos 
sobre el reconocimiento de las palabras escritas. Hoy se dispone de abundante información 
sobre las características de las palabras que determinan los tiempos que se tarda en acceder a 
su significado y/o pronunciación. Aunque las diferencias entre las distintas palabras son 
pequeñas (se trata de milisegundos, es decir, la milésima parte de un segundo), aparecen de 
manera constante y en la mayoría de las personas: tardamos unos milisegundo más en 
reconocer una palabra de ocho letras que una de seis, tardamos unos milisegundos más en 
reconocer una palabra de baja frecuencia que otra de alta frecuencia, etc. El interés en estudiar 
los efectos que las diferentes variables tienen sobre los tiempos de reacción radica en que a 
través de esos efectos es posible inferir los procesos cognitivos que intervienen en la lectura en 
general y en cada situación particular. Así, si en un experimento de lectura en voz alta se 
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comprueban efectos de las variables consideradas semánticas, cabe inferir que los 
participantes estaban accediendo al significado de las palabras, aun cuando la tarea fuese sólo 
de lectura en voz alta. 

Son muchas las variables que influyen sobre los tiempos de reconocimiento de las palabras 
escritas y diferentes los procesos sobre los que intervienen. Los efectos de algunas de esas 
variables, como la frecuencia, la edad de adquisición o la imaginabilidad, son compartidos por 
el reconocimiento oral de palabras y la lectura. Así, también en la lectura la frecuencia de uso 
es una de las variables más influyentes. Cuantas más veces vemos escrita una palabra, menos 
tiempo tardamos en reconocerla. Las palabras más frecuentes muestran un rendimiento mejor 
en todas las tareas: se identifican con menos tiempo de exposición sobre una pantalla, se 
responden antes en la tarea de decisión léxica, se leen más rápido en voz alta y las fijaciones 
oculares son más cortas. Lo mismo sucede con la edad de adquisición, que es otra variable 
sumamente importante en el reconocimiento de las palabras escritas, con independencia de la 
metodología que se utilice. Asimismo, la vecindad ortográfica, o número de palabras que 
comparten con ella todas sus letras excepto una y en las mismas posiciones, también influye 
sobre los tiempos de reacción. 

Sin embargo, la variable punto de unicidad —que es tan determinante en el reconocimiento 
oral de palabras- apenas tiene importancia en la lectura, puesto que la palabra aparece 
completa ante nuestros ojos (contrariamente al lenguaje oral, en el que los sonidos van 
llegando uno tras otro) y las letras son identificadas todas a la vez en paralelo (al menos con las 
palabras frecuentes). 

Otras variables, en cambio, son más influyentes en el lenguaje escrito que en el oral. Por 
ejemplo, la longitud de las palabras es determinante en la tarea de lectura en voz alta. Los 
tiempos de lectura de una palabra se incrementan casi de manera lineal con su número de 
letras. De hecho, Gough (1972) estimaba en unos 10-20 segundos por cada letra de más que 
tuviesen las palabras. Este efecto lineal de la longitud se produce más en las palabras de baja 
frecuencia y las seudopalabras -por las razones que explicaremos más adelante- y menos con 
las palabras de alta frecuencia. Generalmente se mide la longitud de las palabras por el número 
de letras, aunque también se puede medir por el número de sílabas, sobre todo en los idiomas 
silábicos como el español o el francés. 

También en castellano son especialmente relevantes la frecuencia de sus sílabas y su 
complejidad morfológica, ya que se trata de un idioma con una estructura claramente silábica y 
una gran riqueza morfológica. Sin embargo, parecen tener efectos opuestos, dado que la 
frecuencia de las sílabas entorpece el reconocimiento de las palabras (a mayor frecuencia de 
las sílabas, mayores los tiempos de reacción), mientras que la frecuencia de los morfemas 
(especialmente los prefijos) lo favorece (Domínguez, Alija, Rodríguez-Ferreiro y Cuetos, 
2010). 

El papel de la sílaba en castellano ha sido muy estudiado y se ha comprobado que las palabras 
formadas por sílabas muy frecuentes dan lugar a tiempos más lentos que las palabras formadas 
por sílabas poco frecuentes. En un primer estudio, basado en la lectura de textos mediante la 
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técnica de la ventana móvil, de Vega et al. (1990) comprobaron que, una vez eliminado el 
efecto de otras variables, el procesamiento de cada palabra estaba relacionado negativamente 
con la frecuencias posicionales de sus sílabas (es decir, su frecuencia de aparición en el idioma 
en determinadas posiciones dentro de la palabra), de manera que, paradójicamente, las 
palabras con sílabas muy frecuentes requerían mayores tiempos de lectura. 

Empleando la tarea de decisión léxica, Carreiras, Alvarez y de Vega (1993) constataron de 
nuevo el efecto silábico inhibitorio: las latencias de las respuestas, una vez controladas otras 
variables potencialmente influyentes, eran más largas ante palabras con alta frecuencia 
silábica posicional que ante palabras con baja frecuencia silábica posicional, y este efecto era 
más pronunciado en las palabras de baja frecuencia léxica. Este efecto inhibitorio se interpreta, 
por lo general, en términos de competición entre unidades de representación léxica: si las 
sílabas son de alta frecuencia, activarán más unidades léxicas que las de baja frecuencia, y 
estas unidades competirán en el proceso de identificación de la palabra. 

Por otra parte, no todas las sílabas son igualmente importantes; hay evidencia de que la 
primera sílaba tiene un estatus especial en el proceso de activación de una unidad léxica. Hay 
que destacar que muy probablemente el efecto de la sílaba es, al menos en una lengua romance 
como el español, de naturaleza claramente fonológica, no el subproducto de la mera secuencia 
de letras, explicable por la redundancia ortográfica. 

Por último, hay una variable sumamente influyente sobre la velocidad lectora, pero que sólo 
afecta a los idiomas de ortografía opaca, como el inglés, que es la regularidad entre las formas 
escritas y su pronunciación. Los diferentes idiomas varían notablemente en la regularidad de 
sus sistemas ortográficos. Hay sistemas, como el italiano, el finlandés o el castellano, que son 
muy transparentes, ya que cada grafema se pronuncia siempre de la misma manera. Así, por 
ejemplo, la letra «a» en castellano se pronuncia siempre /a/ independientemente de la palabra 
que forme. Por el contrario, otros idiomas, como el francés, el danés y especialmente el inglés, 
tienen sistemas muy opacos, porque la pronunciación de las letras depende muchas veces de la 
palabra en la que aparecen. En inglés, la «a» de 'cat' se pronuncia de manera completamente 
diferente de la «a» de 'basic', y la «i» de 'pint' es muy distinta de la «i» de 'pink' En 
consecuencia, es bastante frecuente que los ingleses se encuentren con palabras que no 
conocen y que, por lo tanto, no saben cómo tienen que pronunciarse (y es por ello que siempre 
que deben escribir un apellido desconocido preguntan cómo se deletrea). Por esta razón, en 
inglés, la regularidad es una variable determinante del reconocimiento visual de palabras: los 
ingleses tardan más y cometen más errores al leer palabras irregulares. También es la causa de 
que los niños ingleses tarden mucho más tiempo en aprender a leer. 

En castellano, al ser un idioma con un sistema ortográfico totalmente transparente (Tabla 
11-1), no existe ese problema, ya que todas las palabras son regulares y uno puede leer sin 
dificultad cualquier palabra aunque nunca la haya visto. 
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Tabla 11-1. Correspondencias entre grafemas 
y fonemas en castellano 


Grafema Fonema Grafema Fonema 
A la/ T It) 
B lb] U lul 
D ld] V lo] 
E lel X Iksl, lx! 
F 1£/ Z 10] 
| lil LL lyl 
J lil RR IR/ 
K Ik CH 1) 
L NN QU Ik/ 
M /m/ y lvl, lil 
N In] G al. lxl 
Ñ In! C 181, |k/ 
0 lo] R Ir/, IR/ 
P Ipl GU ll, lgu/ 
S /s] 


No ocurre así en la escritura (Recuadro 11-3). 


Recuadro 11-3. Escritura de palabras 


Mientras que en castellano la lectura es totalmente transparente, la escritura no es tan regular, 
dado que existen algunos sonidos que pueden representarse con varias letras diferentes. Así, 
el sonido /k/ se puede representar con las letras «k», «c» y «qu», el sonido /b/ con las letras 
«b» y «v», el sonido /0/ con las letras «c» y «z», etc. Esto significa que existen muchas 
palabras que no se pueden escribir de manera ortográficamente correcta si no se conocen, es 
decir, si la persona que las escribe no dispone de representación ortográfica de esas palabras 
en su memoria. Esto ocurre sobre todo con las palabras de ortografía arbitraria, es decir, las 
que no se ajustan a ninguna regla ortográfica (p. ej., «zanahoria», «hotel», «bota», etc.). 
Cuando se ajustan a determinadas reglas ortográficas (p. ej., «hueso», que sabemos que se 
escribe con «h» porque así sucede con todas las palabras que empiezan por «ue»), no es 
necesario disponer de representación ortográfica para escribirla correctamente. 

Esta irregularidad en la escritura determina que el proceso de aprendizaje de la escritura sea 
mucho más largo que el de la lectura, ya que los aprendices necesitan formar representaciones 
de las palabras de ortografía arbitraria para poder escribirlas correctamente, y aun así siempre 
se pueden encontrar con alguna palabra desconocida (¿cómo escribiría el lector las palabras 
/badiano/ y /badián/?). 

Por otra parte, la existencia de palabras de ortografía arbitraria hace imprescindible la 
presencia de dos vías de escritura en castellano: una subléxica para las palabras desconocidas 
y otra lexicoortográfica para las palabras de ortografía arbitraria, siempre que sean familiares 
y la persona que escribe disponga de una representación de esa palabra en su memoria. 
Cuando tiene que escribir una palabra de ortografía arbitraria y desconocida (p. ej., 
/irkocerbo/ (animal mitológico) hace uso de ambas vías: la subléxica eligiendo los grafemas 
más frecuentes y la léxica buscando palabras familiares parecidas (Cuetos, 1993). Así, es 
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posible que irkocerbo la escriba con «v» por su parecido con «ciervo» y, ciertamente, se 
escribe «hircocervo». 

Por cierto, /badiano/ se escribe con «v», ya que vadiano significa hereje del siglo iv que seguía 
las doctrinas de Audio, mientras que /badián/ se escribe con «b», dado que badián es un árbol 
del oriente. 


Sólo existen algunas palabras extranjeras, de uso cada vez más común, que se conservan en su 
forma ortográfica y pronunciación, como "Hollywood", 'Renault', 'google', 'facebook', etc. A la 
mayoría de las palabras extranjeras las regularizamos cuando las incorporamos a nuestro 
idioma (p. ej., iglú, champú, etc.). 

Esta regularidad del castellano es una de las principales causas de que los niños españoles 
aprendan a leer con relativa rapidez. Seymour, Aro y Erskine (2003) compararon el 
aprendizaje de la lectura de 14 idiomas europeos y constataron que los niños de sistemas 
ortográficos transparentes, como el griego, el finlandés o el italiano, aprendían a leer mucho 
antes que los de idiomas opacos, como el danés o el inglés. Mientras que los niños griegos 
leían correctamente el 98 % de las palabras y el 92 % de las seudopalabras ya en el primer año 
de aprendizaje y los españoles el 95 % y el 89%, respectivamente, los escoceses sólo leían el 
34 % de las palabras y el 29 % de las seudopalabras. 

En definitiva, es evidente que son muchas las variables que influyen sobre el reconocimiento 
de las palabras escritas. Esto significa que hay que ser muy cuidadoso cuando se realiza una 
selección de palabras para un experimento o incluso para un estudio con pacientes que tienen 
trastornos del lenguaje. No se puede concluir que cierta variable, por ejemplo, la categoría 
gramatical, influye sobre los resultados si no se han tenido en cuenta las otras variables, más 
aun si se considera que muchas variables están muy asociadas entre sí y presentan altas 
correlaciones. Por ejemplo, las palabras que se adquieren a edad más temprana suelen ser las 
más frecuentes, las más concretas y las más cortas. También existe una alta correlación entre 
frecuencia y longitud, puesto que las palabras de alta frecuencia son, en su mayoría, cortas y, 
de hecho, cuando una palabra larga se convierte en frecuente se termina acortando (p. ej., 
televisión se ha convertido en «tele», automóvil en «auto», etc.). Por otra parte, los efectos de 
cada variable están modulados por las restantes variables; ésta es la razón por la que en los 
experimentos de reconocimiento de palabras aparezcan muchas interacciones entre las varia- 
bles, por ejemplo entre frecuencia y longitud, en el sentido de que la longitud es más influyente 
en las palabras de baja frecuencia, o entre regularidad e imaginabilidad, ya que los efectos de 
imaginabilidad son mayores en las palabras irregulares. 

Estas interacciones entre las variables y el papel que cada una cumple en las distintas tareas 
nos permiten hacer deducciones acerca de los componentes del sistema lector sobre los que 
influye cada variable. Sin duda, el estudio de las variables ha sido el factor clave para la 
construcción y puesta a prueba de los modelos de lectura que se expondrán en el apartado 
siguiente. Sólo los modelos que son capaces de explicar los efectos de las variables resisten; el 
resto desaparece, razón que explica la importancia de estos estudios. 


booksmedicos.org 


19 


Psicología del Lenguaje — TEMA 11 


En el caso de algunas variables hay claro consenso sobre cuál es su locus de actuación en el 
sistema lector. Así, todos los investigadores están de acuerdo en que la frecuencia de uso actúa 
a nivel léxico cuando tenemos que reconocer una palabra entre las otras miles que conocemos. 
También la vecindad ortográfica actúa a nivel léxico. La imaginabilidad, en cambio, es una 
variable semántica, es decir, actúa cuando accedemos al significado de las palabras. Una 
prueba empírica que suele citarse como apoyo de que es una variable semántica es que tiene 
mayores efectos en las pruebas que requieren mayor participación semántica. Así, los efectos 
de la imaginabilidad son muy robustos en la tarea de categorización semántica, algo más 
débiles pero importantes en la tarea de decisión léxica, y pequeños en la tarea de lectura en voz 
alta, en la que los lectores pueden leer sin acceder al significado. También se ha comprobado 
que los efectos de la imaginabilidad son más fuertes en las palabras irregulares, y que los 
efectos de la imaginabilidad aumentan en la tarea de decisión léxica cuando se utilizan 
seudopalabras muy parecidas a palabras reales, lo que exige a los participantes procesar más 
profundamente las palabras. La edad de adquisición puede tener múltiples puntos de 
actuación, pero uno de ellos parece ser el semántico, puesto que sus efectos son mayores en las 
tareas que requieren la participación semántica, aunque también parece actuar a nivel léxico y 
fonológico. 
Por otra parte, hay que tener en cuenta que los efectos de las variables descritos previamente se 
obtuvieron sobre todo en experimentos en los que se presentaban las palabras aisladas para po- 
der estudiar esos efectos fuera de otras influencias. Pero ¿se mantienen esos efectos cuando las 
palabras aparecen dentro de un texto? Ciertamente, el contexto facilita el reconocimiento de 
las palabras, pues cuando una palabra forma parte de un texto o va precedida de otra relacio- 
nada (experimentos de priming) los tiempos de respuestas son más rápidos. Además, el 
contexto modula el papel de las variables, de manera que una variable como la imaginabilidad, 
influyente cuando se presentan palabras aisladas, puede no tener efectos significativos cuando 
se presentan textos. 
Lo que sí se sabe desde hace tiempo es que el contexto ayuda a reconocer las palabras pero no 
parece influir en el acceso al significado, ya que cuando leemos una palabra polisémica se acti- 
van todos sus significados, incluidos los que no son apropiados para el contexto. En un experi- 
mento ya clásico, Swinney (1979) presentaba oraciones en las que aparecía una palabra 
ambigua, como «plantas» en el siguiente ejemplo. El contexto podía ser neutro, ya que no 
indica si plantas se refiere a los pisos del edificio o a los vegetales o podía ser sesgado al hacer 
referencia clara a los vegetales. 

Neutro: uno de los mayores problemas de los modernos edificios de oficinas es el de la 

limpieza, debido a la gran cantidad de plantas que tienen. 

Sesgado: uno de los mayores problemas de los modernos edificios de oficinas es el de la 

limpieza, debido a la gran cantidad de hortensias, ficus y otras plantas que tienen. 
A continuación, los sujetos tenían que realizar una tarea de decisión léxica en la que se 
presentaban referencias a ambos significados, «pisos» y «flores», junto con otra palabra de 
control, por ejemplo, «libros». Swinney comprobó que cuando la palabra aparecía justo 
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después del contexto sesgado, tanto la palabra relacionada «flores» como la no relacionada 
«pisos» se reconocían antes que la de control, pero cuando aparecía 700 ms más tarde sólo se 
producían tiempos cortos con la palabra relacionada. Esto significa que en los primeros 
milisegundos se activan todas las representaciones léxicas que corresponden a la palabra 
escrita, con independencia de que sean o no plausibles por su significado, aunque poco 
después ya sólo queda activada la correspondiente al significado. 

e Modelos de reconocimiento de palabras escritas 
Con objeto de explicar los datos empíricos descritos anteriormente, se han propuesto 
diferentes modelos a lo largo de los años. Algunos de ellos han ido desapareciendo al no poder 
explicar todos los datos que se iban generando. Actualmente los dos modelos más conocidos 
son el modelo dual y el de triángulo 
El primer modelo famoso fue el logogén propuesto inicialmente por Morton en 1969 y descrito 
en el capítulo 6, que intentaba explicar los datos para el reconocimiento de palabras tanto 
escritas como habladas. Se trata de un modelo de activación, dado que cada palabra está 
representada por un mecanismo -al que denominó logogén- que se activa cuando se 
corresponde con el estímulo que se está procesando. Así, cuando una persona lee la palabra 
«barco» se activará el logogén correspondiente a esa palabra. Cada vez que se activa un 
logogén su umbral de activación disminuye, de manera que cuantas más veces se lea una 
palabra, cuanto mayor es su frecuencia, menor es su umbral de activación y, por lo tanto, más 
fácil resulta reconocerla. 
Otro modelo conocido es el de búsqueda propuesto por Forster en 1976, que utiliza la metáfora 
de la biblioteca y que también ha sido explicado en el capítulo 6. De la misma manera que en 
las bibliotecas hay archivos en los que se encuentran las fichas de los libros por distintos 
órdenes (alfabético, temático, etc.) y hay estanterías en las que se encuentran los libros, en este 
modelo hay también unos archivos periféricos donde se encuentran las representaciones de las 
palabras. Distingue tres tipos de archivos: fonológico para el lenguaje oral, ortográfico para el 
escrito y sintáctico-semántico. Además, está el archivo general, donde se almacena toda la 
información referente a la palabra, incluido el significado. Dentro de cada archivo periférico 
las representaciones se hallan ordenadas por orden de frecuencia, de manera que cuando 
leemos una palabra buscamos en el archivo de las representaciones ortográficas hasta 
encontrarla. Cuanto más frecuente sea esa palabra, más arriba estará en el archivo y menos 
tardaremos en llegar a ella. Y, al igual que la ficha de la biblioteca nos lleva al libro, una vez 
que llegamos a la representación de una palabra en el archivo periférico, esa representación 
nos conduce a la información en el archivo general. 
Actualmente, sin embargo, los dos modelos más defendidos son el modelo dual o modelo de 
doble ruta y el modelo de triángulo. El modelo dual fue propuesto por Coltheart a partir del 
modelo del logogén, añadiendo nuevos componentes para explicar los datos que iban 
surgiendo tanto desde la psicología experimental con individuos sanos, como desde la 
neuropsicología con pacientes que habían sufrido lesiones cerebrales. El modelo de triángulo 
es un modelo conexionista, propuesto por Seidenberg y McClelland en 1989 a partir del 
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modelo procesamiento distribuido en paralelo (PDP) formulado por McClelland y Rumelhart 
en 1981. Además, han surgido otros modelos que tratan de combinar los dos anteriores, como 
el de Perry, Ziegler y Zorzi (2007), o modelos como el de Ans, Carbonnel y Valdois (1998) 
dirigido a las palabras polisílabas que habían sido descuidadas en los modelos anteriores, 
centrados como estaban en las palabras monosílabas. 

El modelo dual propone dos vías o procedimientos para pasar de la palabra escrita al 
significado (en el caso de la lectura comprensiva) o a la pronunciación (en el caso de la lectura 
en voz alta): la vía subléxica, que permite leer las palabras mediante la aplicación de las reglas 
grafema-fonema, transformando cada letra o grafema en su correspondiente fonema, y la vía 
léxica, que permite leer directamente las palabras al activar las representaciones que de ellas 
tenemos en nuestro léxico visual. Esta vía léxica tiene, en realidad, dos variantes: la vía léxica 
pura, que conecta directamente el léxico ortográfico con el fonológico, lo que permite reco- 
nocer las palabras y leerlas en voz alta sin entrar en su significado, y la vía lexicosemántica, 
que pasa por el sistema semántico. Esta última vía es indispensable para comprender las 
palabras (Fig. 11-7). 


Unidades de letra 


La vía léxica es muy útil porque permite leer de una 
manera más fluida al reconocer y pronunciar 
directamente las palabras. "También es necesaria para la 
lectura de palabras irregulares, aunque estas palabras 


sólo existen en sistemas ortográficos opacos como el 


ES 


Ai LÉXICO 
y ortográfico 


Reglas de 
conversión 
grafema- 
fonema 


inglés. Pero sólo se puede utilizar con las palabras 
familiares que ya se han leído en ocasiones previas para 
poder tener representación de ellas en el léxico. La vía 
subléxica, en cambio, se puede utilizar con cualquier 


n Léxico * 
| fonológico 


* 


Fonemas 
Vía subléxica 
--- Vía léxica 


Figura 11-7. Modelo de doble ruta en cascada. 


palabra, sea familiar o no, e incluso con palabras 
desconocidas y seudopalabras, porque las reglas 
grafema-fonema son aplicables a cualquier estímulo, 
siempre que la pronunciación sea regular. No sirve, en 
cambio, con las palabras irregulares. 


— Vía léxico-semántica 


Tanto cuando se utiliza la vía léxica como la subléxica, 
el primer paso que se ha de realizar es siempre el de identificación de las letras. A partir de ahí 
ya se puede tomar una de las dos vías (o las dos). Si nunca hemos visto la palabra que tenemos 
delante, por ejemplo, «golimbro» (aficionado a comer golosinas), entonces no podremos tener 
una representación de ella en nuestro léxico y, por lo tanto, la única forma de leerla será 
aplicando las reglas de conversión grafema-fonema. Sabemos cómo se pronuncian la «g», la 
«0», la «1», la «i», etc., así que podremos pronunciar todas las letras y leer en voz alta la 
palabra (aunque no tengamos ni idea de su significado). Si, por el contrario, la palabra que 
tenemos delante es conocida pero de pronunciación irregular, esto es, no se ajusta a las reglas 
grafema-fonema (p. ej. Hollywood) entonces sólo podremos leerla a través de la vía léxica, 
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reconociendo su forma en el léxico visual y recuperando su pronunciación en el léxico 
fonológico. 

Cuando se trata de una palabra familiar y regular, se ponen en marcha las dos vías, lo que 
facilita una lectura rápida y precisa. Dependiendo de la palabra, una de las vías puede ser más 
eficaz que la otra; así, si se trata de una palabra corta como «asa» o «tela», en las que el número 
de reglas grafema-fonema que hay que aplicar es escaso, posiblemente la vía subléxica sea 
más rápida; en cambio, con una palabra larga, en la que hay que aplicar muchas reglas, como 
«rinoceronte», posiblemente la vía léxica sea la más efectiva. En cualquier caso, sea cual fuere 
la palabra, las dos vías se ponen en funcionamiento. Esta es la razón de que cometamos tan 
pocos errores en la lectura, porque si falla una de las vías está la otra para sustituirla. 

En un principio, los niños sólo usan la vía subléxica, puesto que no tienen palabras 
representadas en su léxico visual, pero a medida que se van haciendo lectores expertos y van 
leyendo una y otra vez las mismas palabras, van formando representaciones y pueden leerlas 
directamente a través de la vía léxica. Con la participación de la vía léxica la lectura se hace 
más rápida y fluida, porque ya no se realiza una lectura serial, sino que todas las letras se 
identifican en paralelo. 

Contrariamente a la vía subléxica, que tiene que ser enseñada de manera sistemática, la vía 
léxica no requiere un aprendizaje sistemático, sino que son los propios niños quienes al leer 
una y otra vez las palabras terminan formando representaciones de esas palabras. Es lo que 
Share denomina autoaprendizaje. En consecuencia, a medida que los niños van leyendo más, 
forman más representaciones de las palabras (van aumentando su léxico ortográfico) y, por 
consiguiente, su lectura se hace más fluida. Por otra parte, van cambiando los efectos de las 
variables, puesto que la longitud de las palabras influye más en los primeros cursos cuando los 
niños utilizan la vía subléxica, ya que, cuantas más conversiones grafema-fonema tienen que 
hacer, mayor será el tiempo de lectura, mientras que, a medida que se hace una lectura léxica, 
mayor protagonismo adquirirán las variables léxicas como la frecuencia o la edad de 
adquisición. En un estudio realizado con niños durante los primeros años de aprendizaje de la 
lectura, Cuetos y Suárez-Coalla (2009) encontraron que la longitud influía notablemente en los 
primeros cursos, pero su influencia descendía paulatinamente a medida que se ascendía de 
nivel. Por el contrario, la frecuencia no influía en los primeros niveles pero sí en los superiores. 
En un principio, el modelo dual era puramente serial, ya que un componente no comenzaba a 
funcionar hasta que terminaba el anterior. En una versión más reciente del modelo, al que se 
denominó modelo de doble ruta en cascada, Coltheart et al. (2001) propusieron un 
funcionamiento de tipo computacional. En este nuevo modelo la vía subléxica opera de 
manera serial, puesto que la conversión de grafemas en fonemas necesariamente se tiene que 
hacer de manera sucesiva, pero el funcionamiento de la vía léxica se produce en paralelo y en 
cascada, como se ilustra en la figura 11-7. Con este modelo computacional se explican algunos 
datos difíciles de explicar con el modelo clásico, por ejemplo que la vía léxica sea más rápida 
que la subléxica, pues el trabajo en paralelo, sin duda, agiliza el proceso. 


booksmedicos.org 


23 


Psicología del Lenguaje — TEMA 11 


¡| El principal rival del modelo dual es el modelo de 
triángulo, de tipo conexionista. Este modelo no distingue 
entre vía léxica y vía subléxica, puesto que todos los 
estímulos, sean palabras familiares, palabras 
desconocidas o incluso seudopalabras, se leen por el 
mismo procedimiento. En este modelo existen tres 
niveles: ortográfico, fonológico y semántico, los tres 
unidos entre sí mediante unidades ocultas, como se 
| muestra en la figura 11-8, y la facilidad para leer las 
o sense” palabras depende de la fortaleza de esas conexiones. 
Cada vez que se lee una palabra y se activan las representaciones correspondientes a ella, 
mayor es la fuerza de la conexión. Esto significa que las palabras de alta frecuencia serán 
reconocidas más rápidamente que las de baja frecuencia y que las seudopalabras, puesto que 
sus conexiones son más fuertes. No obstante, este modelo también dispone de dos vías, en 
cierto modo similares a las del modelo dual, para la lectura en voz alta de las palabras: una que 
conecta directamente la ortografía con la fonología (parecida a la vía subléxica) y otra que lo 
hace a través de la semántica (parecida a la vía lexicosemántica). Asimismo, para el acceso al 
significado se puede pasar directamente de la ortografía a la semántica o se puede ir a través de 
la fonología. 24 
Aunque el modelo dual es muy popular entre los investigadores que trabajan sobre la lectura, 
los modelos conexionistas están teniendo gran aceptación porque están inspirados en el 
funcionamiento cerebral y tratan de simular las redes neuronales. Contrariamente a los 
modelos simbólicos como el dual, los modelos conexionistas no conciben el sistema de lectura 
formado por módulos, sino por redes compuestas por un gran número de unidades o nodos 
conectados entre sí y que funcionan de manera similar a las redes neuronales. Además, en este 
modelo, los distintos componentes del sistema trabajan en paralelo, por lo que no es necesario 
que un componente termine de funcionar para que empiece a funcionar el siguiente (algo que 
también ocurre en el funcionamiento cerebral). 
Otra ventaja sobre el modelo dual es que se trata de un sistema que mejora con la práctica, por 
lo que sirve para explicar el aprendizaje de la lectura. Este modelo no incluye reglas de 
conversión grafema-fonema, sino que la relación entre las letras y los sonidos aparece en el 
curso del entrenamiento del sistema. Cuantas más veces un grafema aparezca asociado a un 
determinado sonido, más fuerte se hará la conexión. 
Estos dos modelos continúan vigentes porque ambos son capaces de explicar los principales 
resultados encontrados en los estudios de reconocimiento de palabras. Así, en el caso de la 
variable lexicalidad, según el modelo dual, las palabras se leen más deprisa que las 
seudopalabras porque se hace uso de las dos rutas, mientras que las seudopalabras sólo se 
pueden leer a través de la vía subléxica, y en el modelo conexionista porque la fortaleza de las 
conexiones es mayor en el caso de las palabras por haber sido leídas en ocasiones anteriores. 
Respecto al efecto frecuencia de las palabras, las explicaciones son bastante similares en 
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ambos modelos, ya que en el modelo dual se explica por el umbral más bajo de las palabras 
frecuentes y en el modelo de triángulo por la mayor fortaleza de las conexiones en las palabras 
frecuentes. Algo similar ocurre con la variable vecindad en el sentido de que las palabras con 
muchos vecinos se leen más rápido porque se activan las representaciones léxicas de las que 
comparten letras con ellas y eso acelera la pronunciación. Una interacción siempre encontrada 
y que apoya especialmente al modelo dual es la interacción frecuencia por longitud, en el 
sentido de que la longitud afecta más a las palabras de baja frecuencia que a las de alta 
frecuencia. De acuerdo con este modelo, las palabras de alta frecuencia se leen a través de la 
vía léxica y, por lo tanto, todas las letras se identifican en paralelo, mientras que las palabras de 
baja frecuencia se tienen que leer a través de la vía subléxica y, por consiguiente, cuantos más 
grafemas tenga, más reglas de conversión grafema-fonema se tienen que aplicar y, además, de 
forma sucesiva. También la interacción frecuencia por regularidad, producida porque las 
palabras irregulares requieren más tiempo que las regulares -pero sólo cuando se trata de 
palabras de baja frecuencia, dado que en las de alta frecuencia no hay diferencias entre las 
regulares y las irregulares-, es fácilmente explicada por el modelo dual en el sentido de que las 
palabras de alta frecuencia se leen a través de la vía léxica y en ese caso no influye la 
regularidad de sus grafemas, mientras las de baja frecuencia requieren la participación de la 
vía subléxica. 

En un intento de aprovechar las ventajas de los dos modelos anteriores, Perry, Ziegler y Zorzi 
(2007) elaboraron un nuevo modelo que supone una síntesis de los dos. Parte de los supuestos 
conexionistas, pero incorpora las vías léxica y subléxica. La lectura es el resultado de ambas 
vías que se unen en el almacén de salida fonológica. Gracias a su arquitectura conexionista 
este modelo es capaz de aprender, lo que lo coloca en ventaja respecto al modelo dual, y 
gracias a su vía subléxica consigue mejores resultados con las seudopalabras y replica la 
interacción entre frecuencia y longitud, lo que lo sitúa en ventaja respecto al modelo de 
triángulo. 

También Ans, Carbonell y Valdois (1998) propusieron un modelo de lectura de tipo 
co-nexionista que sirve para cualquier palabra, corta o larga, familiar o desconocida. De 
acuerdo con este modelo, el sistema lector cuenta con dos procedimientos que trabajan de 
manera sucesiva: un procedimiento global, que usa el conocimiento completo de la palabra y 
permite leer las palabras familiares, y un procedimiento analítico, que se basa en la activación 
de los segmentos silábicos de las palabras y funciona cuando no se puede reconocer 
globalmente la palabra. 


BASES NEUROLÓGICAS DE LA LECTURA 

En el poco tiempo que tardamos en leer en voz alta una palabra (unos 500 ms por término 
medio) y menos para comprenderla (unos 250 ms) realizamos un buen número de operaciones 
cognitivas, como se ha explicado en los apartados anteriores: análisis visual, identificación de 
las letras, procesamiento fonológico, procesamiento semántico, etc. Se calcula que 
aproximadamente los primeros 100 ms se destinan al procesamiento visual de la palabra 
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(análisis de los rasgos visuales e identificación de las letras) y los 150 ms siguientes al 
procesamiento fonológico y semántico. Los 250 ms restantes, hasta completar los 500 ms, se 
emplean en activar y ejecutar los programas motores para pronunciar las palabras. Cada una de 
estas Operaciones depende, lógicamente, del funcionamiento de ciertas áreas cerebrales y en la 
actualidad, gracias a las técnicas neurofisiológicas y de neuroimagen, tenemos una idea 
bastante aproximada de lo que ocurre en nuestro cerebro mientras leemos (Cuetos, 2011). 

Es evidente que las primeras zonas cerebrales que se ponen en funcionamiento cuando leemos 
tienen que ser las áreas visuales, situadas en los lóbulos occipitales, pues es a ellas adonde 
llega la información procedente de los ojos. En esas áreas se realizan las primeras operaciones 
de análisis de los rasgos de las letras para conseguir identificarlas. Es evidente también que las 
últimas zonas del cerebro que entran en funcionamiento son las zonas motoras en los lóbulos 
frontales, desde donde se envían las órdenes a los músculos del aparato fonador (laringe, 
lengua, labios, etc.) para la articulación de los fonemas. Entre esas dos áreas hay muchas otras, 
fundamentalmente en el hemisferio izquierdo, que también se ponen en funcionamiento para 
llevar a cabo el procesamiento fonológico, ortográfico y semántico. 


Recuadro 11-4. Área de la forma visual de las palabras 


Cuando se comparan los cerebros de lectores expertos con los cerebros de analfabetos se ob- 
serva que las mayores diferencias se localizan en una zona próxima al área visual en el hemisferio 
izquierdo, en la confluencia de los lóbulos temporal y occipital. Mientras que en los lectores se 
produce gran activación en esa zona cuando tienen delante material escrito, en los analfabetos 
apenas se produce activación. Además, el grado de activación está determinado por la destreza 
lectora: cuanto más fluida es su lectura, mayor activación se produce en esa área. De ahí que se 
la conozca con el nombre de área de la forma visual de las palabras o también caja de las letras 
en el cerebro (Fig. 11-9). 


Esta área, junto con la simétrica del hemisferio de- 
recho, tiene como función natural el reconocimiento 
de los estimulos visuales, objetos, animales, caras, etc., 
pero con el aprendizaje de la lectura se produce un re- 
ciclaje neuronal y la zona del hemisferio izquierdo se 
especializa en el reconocimiento de letras y palabras. 
Así pues, una parte de la corteza cuya función era el 
reconocimiento de determinados estímulos visuales em- 
pieza a dedicarse al procesamiento del material escrito. 
- En concreto, la zona que ocupan las palabras es la de- 
Figura 11-9. Área de la forma visual dedicada principalmente al reconocimiento de caras. Para 
las palabras. compensarlo, el hemisferio derecho de los lectores se 

especializa más en el reconocimiento de caras. De esta 
manera, el aprendizaje lector implica que esa zona occipitotemporal del hemisferio izquierdo se 
encarga de procesar las letras y palabras, y la parte correspondiente del hemisferio derecho, del 
procesamiento de caras. De hecho, otra diferencia entre lectores y analfabetos es que en los pri- 
meros se produce mayor activación del hemisferio derecho durante el reconocimiento de caras. 


Además, esa área del hemisferio izquierdo es la caja cerebral de las letras para todos los lecto- 
res, con independencia del método con el que hayan aprendido a leer, sea éste fonético, silábico 
o global, y con independencia del sistema ortográfico al que pertenezcan los lectores (españoles, 
ingleses, chinos, etc.). Por otra parte, esa región se activa sólo ante las palabras escritas, y no lo 
hace frente a otros estimulos visuales, como números, figuras o caras, ni tampoco ante palabras 
habladas (a no ser que uno trate de imaginarlas visualmente). Su desarrollo está determinado por 
el aprendizaje lector; así, en los niños que están aprendiendo a leer se produce escasa activación, 
pero a medida que van adquiriendo fluidez lectora la activación aumenta y llega al máximo en los 
buenos lectores. De hecho, la activación de esta área no guarda relación con la edad cronológica 
de los niños, sino con su nivel lector. 


Esta área está organizada de manera jerárquica, en el sentido de que en la parte posterior, más 
próxima al área visual, se encuentran las representaciones de las letras, un poco más adelante 
las correspondientes a grupos de letras (bigramas frecuentes como «ch», «gu», «ll» y sílabas), un 
poco más adelante los morfemas y, en la parte más anterior, las representaciones de las palabras 
(Dehaenes, 2009). 
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Una de las áreas más importantes y donde mayor activación se produce cuando leemos es la 
zona parietotemporal, que incluye el área de Wernicke y las circunvoluciones angular y 
supramarginal. En esta área se integra la información visual con la fonológica, siendo, por lo 
tanto, donde se realiza la conversión de los grafemas en fonemas para que las palabras puedan 
ser reconocidas como si se tratase de palabras habladas. 

También es muy importante la zona occipitotemporal, responsable del reconocimiento 
ortográfico de las palabras. A esta área se la conoce como área de la forma visual de las 
palabras (Cohén et al., 2000) porque mediante las técnicas de neuroimagen se ha comprobado 
que se activa ante la presencia de palabras presentadas visualmente, mientras que no se 
observa activación cuando esas mismas palabras se presentan de forma auditiva (Recuadro 
11-4). 

Prueba de su transcendental papel en el reconocimiento ortográfico de las palabras es que, 
cuando se daña como consecuencia de una lesión, los pacientes no consiguen leer las palabras 
globalmente, aunque pueden identificar las letras que las componen. Asimismo, se ha 
comprobado que los niños disléxicos apenas muestran activación en esta área cuando leen. 
La tercera área importante en el procesamiento lector es la que corresponde a las zonas media 
e inferior del temporal izquierdo (Recuadro 11-5). 


Recuadro 11-5. Dislexias evolutivas 


La mayor parte de los niños aprenden a leer, con cierto esfuerzo pero sin grandes dificultades, 
en el período destinado a la enseñanza de la lectura. Sin embargo, hay un pequeño porcentaje 
de niños (se calcula en torno al 3 %) que presentan graves dificultades para aprender a leer sin 
que aparentemente existan causas que lo justifiquen. Puede tratarse incluso de niños que están 
motivados para aprender a leer, que tienen un buen ambiente familiar, que acuden a un buen 
colegio e, incluso, que tienen una inteligencia por encima de la media (hay, de hecho personas 
muy inteligentes que han sido disléxicos, entre los que se incluyen Einstein o Walt Disney). 
Y, a pesar de todo, tienen serias dificultades para aprender a leer. Se trata de niños disléxicos. 
Estas dificultades lectoras se deben a ciertas alteraciones cerebrales. Con las modernas 
técnicas de neuroimagen se ha comprobado que los niños disléxicos tienen menor volumen de 
sustancia gris en los lóbulos temporales, sobre todo el izquierdo, pero especialmente las 
diferencias con los niños normales son mucho más acusadas en la región occipitotemporal 
izquierda, en el área de la forma visual de las palabras. Esta área tan importante para 
conseguir una lectura fluida tiene menos densidad de neuronas en los niños disléxicos. Por el 
contrario, estos niños presentan mayor cantidad de sustancia gris en el lóbulo frontal derecho. 
También se observa en estos niños menor densidad en la sustancia blanca, la cual tiene gran 
importancia puesto que ésta se encarga de conectar las diferentes áreas corticales. En 
particular se ha encontrado menor cantidad de fibras en estos niños en comparación con los 
controles en el fascículo arqueado, que conecta las regiones posterior y anterior del lenguaje, 
y el cuerpo calloso, que conecta los dos hemisferios. 

Como consecuencia de esas deficiencias estructurales, se producen también anomalías 
funcionales, que pueden comprobarse mediante técnicas de neuroimagen funcional. Así, se 
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observa una menor activación del hemisferio izquierdo en los niños disléxicos, especialmente 
en la zona parietotemporal izquierda, correspondiente al procesamiento fonológico, mientras 
realizan tareas lingilísticas, y una menor activación en la zona occipitotemporal izquierda, 
área de la forma visual de las palabras, mientras leen. Por el contrario, muestran mayor 
activación del hemisferio derecho, probablemente debido a las estrategias compensatorias 
que tienen que desarrollar. 

Estas alteraciones cerebrales determinan ciertas dificultades en los niños disléxicos que se 
pueden observar antes de iniciar el aprendizaje de la lectoescritura. Todas ellas se relacionan 
con el procesamiento fonológico, y así estos niños presentan dificultades en tareas de 
conciencia fonológica, del tipo de manipulación de fonemas, rimas, etc. También tienen una 
memoria verbal a corto plazo reducida y, en algunos casos, lentitud en el acceso léxico en 
tareas de denominación de dibujos o de fluidez verbal. Existen dos teorías sobre los trastornos 
fonológicos de las personas disléxicas: una sostiene que las representaciones de los fonemas 
están degradadas (Perrachione, Del ufo y Gabrieli, 2011) y otra postula que no es un 
problema de las representaciones, sino de acceso a ellas (Boets et al., 2013). 


En esta zona se lleva a cabo el procesamiento semántico de las palabras, pues es aquí donde se 
encuentran las redes neuronales responsables de los conceptos. Las lesiones en estas zonas 
producen pérdida de información semántica. 

Finalmente, la cuarta zona que participa en la lectura, aunque sólo en la lectura en voz alta, es 
la que se encuentra en el lóbulo frontal izquierdo, concretamente en el área de Broca. Aquí se 
realiza la recodificación fonológica necesaria para la pronunciación. Desde aquí se envían las 
órdenes al área motora para ejecutar los movimientos encargados de producir el habla (Fig. 
11-10). 


Como ya se ha indicado, la lectura no está programada 
en el cerebro, de manera que para que el sistema lector 
funcione es necesario establecer conexiones entre esas 


: Parietotemporal 
Circunvolución 


frontal inferior FW 


áreas que, en principio, están destinadas a otras 
funciones. El sistema visual permite identificar las letras 
igual que los restantes estímulos visuales, y el sistema 
Figura 11-10. Áreas cerebrales implicadas en la lec auditivo, los fonemas, pero mientras no se establezca la 
es relación entre las letras y sus correspondientes sonidos 


=—Z Occipitotemporal 


no es posible realizar ningún tipo de lectura. Esta asociación entre grafemas y fonemas se 
consigue con la práctica, estableciendo nuevas conexiones en el cerebro, pues es evidente que 
cada aprendizaje implica cambios cerebrales. En este caso, lo que se hace es establecer 
conexiones entre el área visual (donde se identifican las letras) y el área parietotemporal 
(donde se analizan los fonemas). De esta manera, cuando el niño comienza a leer, tiene 
desarrolladas tanto el área visual como la auditiva, y con el aprendizaje de las reglas 
grafema-fonema establece conexiones entre esas dos áreas. Una vez transformadas las letras 
en sonidos, para leer en voz alta ya sólo tiene que utilizar los mismos mecanismos que emplea 
en el lenguaje oral para la repetición, es decir, la conexión, a través del fascículo arqueado, 
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entre la zona parietotemporal y el área de Broca. Esta vía que va del área visual a la zona 
parietotemporal y de ésta a la frontal se denomina circuito dorsal y es la primera que 
desarrollan los niños cuando aprenden a leer. 

A medida que los niños van leyendo las palabras una y otra vez, terminan formando 
representaciones ortográficas de esas palabras, por lo que ya no necesitan convertir cada letra 
en su sonido, sino que pueden leerla de manera global, identificando todas las letras en 
paralelo, lo que produce una lectura más fluida, aunque esta representación ortográfica no 
serviría de mucho si no se asociara con su pronunciación y significado. De ahí que esas 
representaciones ortográficas que se establecen en la zona occipitotemporal, en el área de la 
forma visual de la palabra, se conecten con las zonas media e inferior del temporal izquierdo 
para acceder al significado de las palabras (y con el área parietotemporal para acceder a la 
fonología). En consecuencia, cuando el niño empieza a leer globalmente las palabras, 
comienza a desarrollar una nueva vía que conecta el área de la forma de la palabra con su 
significado en el temporal medio e inferior. Esta conexión sería suficiente para realizar la 
lectura comprensiva. Si además se quiere leerlas en voz alta, se aprovecha la conexión entre el 
temporal y el área de Broca, la misma vía que se utiliza en el habla espontánea o en la 
denominación de dibujos, para pronunciar las palabras. En definitiva, con la lectura léxica se 
desarrolla esta segunda vía, que se denomina circuito ventral. En la figura 11-11 se 
esquematizan ambos circuitos. 


En los lectores expertos, los dos circuitos participan en el 
EAS go proceso de lectura, si bien el papel de cada uno depende 
o A de varios factores relacionados tanto con los estímulos 
como con los lectores. El circuito dorsal tiene gran 
actividad en los comienzos del aprendizaje de la lectura y, 


de hecho, en los niños que están aprendiendo a leer es el 


Vía yentral 
se único que se activa. Se encarga fundamentalmente de 


aioaanaanaa PLOcesar las palabras desconocidas y seudopalabras. En 
tos dorsal y ventral. realidad equivale a la vía subléxica en el modelo dual o a 
la conexión ortografía-fonología en el modelo de triángulo. En cambio, el circuito ventral se 
activa más cuanto más experto sea el lector y funciona más con las palabras familiares, 
especialmente las irregulares. Equivale a la vía lexicosemántica en el modelo dual o a la 
conexión ortografía-semántica en el modelo de triángulo. 

Así como las estrategias de lectura están en buena medida determinadas por el sistema 
ortográfico y, como ya se ha explicado, los ingleses hacen mayor uso de los procesos léxicos 
para poder leer las palabras irregulares, mientras que los lectores de sistemas transparentes 
utilizan más la vía subléxica, también el uso de estos circuitos cerebrales se ve afectado por la 
transparencia de los sistemas ortográficos. 

Paulesu et al. (2000) compararon mediante tomografía por emisión de positrones la activación 
cerebral de estudiantes ingleses e italianos mientras leían palabras y seudopalabras y 
comprobaron que los italianos presentaban mayor activación en la circunvolución temporal 
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superior (componente del circuito dorsal), mientras que los ingleses tenían mayor activación 
en el área de la forma de la palabra (componente del circuito ventral). 


RESUMEN 


e La lectura es una actividad compleja que requiere una gran variedad de operaciones 
cognitivas, incluyendo procesos visuales, lingiísticos y motores que, a su vez, implican 
la intervención de un buen número de áreas cerebrales. Desde que un texto aparece ante 
nuestros ojos hasta que empezamos a leerlo en voz alta sólo pasan unos milisegundos, 
pero en ese corto período de tiempo nuestro cerebro ha realizado una intensa actividad. 
Todo comienza cuando nuestros ojos se fijan en una pequeña parte del texto, no más de 
una palabra o dos, ya que de todo nuestro campo visual realmente sólo podemos leer las 
palabras que caen en la zona foveal, razón por la cual nuestros ojos tienen que estar 
dando continuos saltos, movimientos sacádicos, para poder desplazarse a otras zonas 
del texto. Durante el período de fijación, que dura aproximadamente 250 ms, extraemos 
la información de esas palabras que está en nuestro campo visual. 

e Se han llevado a cabo numerosos experimentos en relación con el reconocimiento de 
palabras escritas (acceso a su significado y pronunciación) utilizando diferentes 
metodologías conductuales y electrofisiológicas. Las más comunes son la tarea de 
decisión léxica y la lectura en voz alta. Con estas metodologías se ha acumulado un 
amplio conocimiento sobre las variables que determinan la rapidez y la precisión en el 
reconocimiento de palabras escritas. Una de las variables más importantes es la 
frecuencia de uso. También son variables muy importantes la edad de adquisición, la 
vecindad ortográfica, la imaginabilidad o la longitud. 

e Para explicar los datos obtenidos con las diferentes metodologías se han construido 
varios modelos de reconocimiento de palabras. Actualmente los dos más conocidos son 
el modelo de doble ruta, que propone dos vías diferentes para la lectura de palabras, una 
vía subléxica para las palabras desconocidas y una vía léxica para las palabras 
familiares, y el modelo conexionista de triángulo, que propone tres componentes, 
ortográfico, fonológico y semántico, unidos entre sí mediante conexiones y en el que la 
velocidad de lectura depende de la fortaleza de esas conexiones. 

e La lectura es una adquisición reciente, como fruto del aprendizaje, en la especie 
humana y, por lo tanto, no está programada en el cerebro. En consecuencia, para que el 
sistema lector funcione es necesario establecer conexiones entre áreas destinadas a 
otras funciones. En concreto, dos son los circuitos cerebrales responsables de la lectura, 
el dorsal y el ventral, que conectan las áreas visuales, en los lóbulos occipitales, con las 
áreas de producción oral, en los lóbulos frontales. El circuito dorsal va desde el área 
visual a la zona parietotemporal y de ésta, a través del fascículo arqueado, al área de 
Broca. El circuito ventral une el área de la forma visual de la palabra con las zonas 
media e inferior del temporal izquierdo y de aquí con el área de Broca. 
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Preguntas de reflexión 


¿Por qué los ojos tienen que estar realizando continuos movimientos saeádieos durante 
la lectura? 

¿Por qué los efectos de la variable frecuencia silábica son diferentes en las tareas de 
decisión léxica y lectura en voz alta? 

¿Cómo interpretan los efectos de lexicalidad el modelo dual y el modelo de triángulo? 
¿Qué zonas del cerebro conecta el circuito dorsal? 

¿Cómo podrías saber si un niño es disléxico viendo su activación cerebral mientras lee? 
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Objetivos de aprendizaje 
Al finalizar el capítulo el alumno será capaz de: 
e Entender los trastornos del lenguaje desde el enfoque de la neuropsicología cognitiva. 
e Conocer los diferentes tipos de trastornos del lenguaje que pueden producirse por lesión 
cerebral, tanto a nivel de comprensión como de producción y tanto en el lenguaje oral 
como en el escrito. 
e Interpretar los trastornos del lenguaje desde el sistema de procesamiento lingúístico. 
e Entender las alteraciones del lenguaje que se producen en las enfermedades 
neurodegenerativas 
e Aprender a evaluar y diagnosticar los diferentes trastornos afásicos. 


INTRODUCCIÓN 

En el capítulo 1 se mencionó que el objetivo de la psicología del lenguaje era entender los 
mecanismos cognitivos y cerebrales que nos permiten producir y comprender el lenguaje. En 
los capítulos siguientes se describió el funcionamiento de esos mecanismos en personas sanas, 
es decir, en personas cuyo sistema de procesamiento lingiístico está intacto. Pero también es 
importante entender qué mecanismos fallan en las personas que sufren trastornos del lenguaje 
como consecuencia de algún daño cerebral, sea producido por un accidente puntual (un 
traumatismo, un accidente cerebrovascular, un tumor, una infección vírica, etc.) o por un 
deterioro progresivo como consecuencia de alguna enfermedad neurodegenerativa 
(Alzheimer, Parkinson, etc.). Estos trastornos del lenguaje se denominan afásicos. 

El estudio de los trastornos afásicos tiene un gran interés para los psicólogos, no sólo por la 
curiosidad de conocer la amplia variedad de alteraciones que existen a causa de lesiones 
cerebrales, sino sobre todo porque a través del estudio de los pacientes se pueden poner a 
prueba los modelos de procesamiento lingúístico. A finales de los años sesenta y principios de 
los setenta del siglo pasado, los psicólogos cognitivos advirtieron que los pacientes con 
trastornos del lenguaje constituyen un valioso medio de poner a prueba los modelos cognitivos 
elaborados en los laboratorios con individuos normales, lo que dio origen a la denominada 
neuropsicología cognitiva. Fue en esa época cuando algunos psicólogos comenzaron a utilizar 
los modelos de procesamiento elaborados en los laboratorios con individuos sanos para 
interpretar los trastornos producidos por lesiones cerebrales. En concreto, suele considerarse 
como fecha oficial de inicio el año 1973, cuando Marshall y Newcombe publicaron un artículo 
sobre dislexias adquiridas como consecuencia de lesión cerebral. Describieron tres tipos de 
dislexias -visual, superficial y profunda—, con diferentes síntomas (Marshall y Newcombe, 
1973). Lo más interesante fue que no se limitaron, como se hacía en estudios anteriores, a 
describir los síntomas, sino que los interpretaron a partir de los modelos de lectura derivados 
del estudio de lectores normales. Cada uno de estos tipos de dislexia se explicaba como 
consecuencia de daños en un componente del sistema lector. Se consideraba, por lo tanto, que 
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la conducta de los pacientes no era diferente de la conducta de las personas sanas; el sistema de 
procesamiento era el mismo, sólo que los pacientes tenían dañado alguno de sus componentes. 
A partir de esa publicación se realizaron numerosos estudios en todos los ámbitos del lenguaje 
y en las demás capacidades cognitivas (memoria, percepción, atención, etc.) que dieron cuerpo 
a una neuropsicología cognitiva cada vez más desarrollada. Muchos psicólogos del lenguaje 
que hasta entonces hacían sólo experimentos de laboratorios comenzaron a interesarse por los 
pacientes, pues consideraban que ésta era una forma más rigurosa de poner a prueba los 
modelos de procesamiento lingúístico. No hay que olvidar que los procesos lingúísticos 
ocurren a gran velocidad y muchos de ellos son realizados de manera automática. Sin 
embargo, algunos pacientes que han sufrido una lesión cerebral presentan enormes 
dificultades para realizar ciertas operaciones y, en algunos casos, es como si realizasen las 
tareas en cámara lenta, permitiendo al investigador su observación. Además, el hecho de que 
algunos pacientes sean incapaces de realizar ciertas tareas mientras que pueden seguir 
haciendo otras incluso más difíciles, es la prueba clara de que los procesos pueden ser 
afectados de manera selectiva. Especialmente la disociación o separación de procesos es 
concluyente cuando se encuentran dos pacientes con síntomas opuestos. Si existe un paciente 
que es incapaz de realizar la tarea X y suponemos que es porque tiene dañado el proceso A 
responsable de esa tarea, pero hace bien la tarea Z que depende del proceso B, podemos 
concluir que los procesos A y B son independientes tanto a nivel cognitivo como neurológico. 
Si, además, existe otro paciente que presenta las características contrarias, es decir, que hace 
bien la tarea X pero es incapaz de realizar la tarea Z, entonces los datos son aún más 
concluyentes. Se habla entonces de una disociación doble entre los procesos A y B (Recuadro 
121): 


Recuadro 12-1. Disociación doble 

Existen muchos casos de disociaciones dobles en la bibliografía científica que demuestran la 
independencia de determinados componentes del sistema de procesamiento lingúístico. Los 
siguientes son, a modo de ilustración, algunos de ellos. 

Nombres frente a verbos. Se han descrito muchos pacientes con graves dificultades para 
procesar verbos, mientras que el procesamiento de nombres permanece intacto. Por el 
contrario, otros pacientes tienen dificultades para procesar nombres pero no verbos. 
Generalmente, los pacientes con trastornos en el procesamiento de verbos tienen localizada la 
lesión en el lóbulo frontal izquierdo, y los pacientes con trastornos en el procesamiento de 
nombres, en el lóbulo temporal izquierdo. 

Seres vivos frente a objetos inanimados. Algunos pacientes reconocen y nombran sin 
dificultad los estímulos que pertenecen a las categorías de seres vivos (animales y plantas), 
pero tienen graves problemas con los objetos inanimados construidos por el hombre. A otros 
pacientes, en cambio, les sucede lo contrario: tienen graves dificultades con los seres vivos y 
ninguna con los objetos inanimados. Muchos pacientes con trastorno específico para los seres 
vivos han sufrido la lesión a causa de una encefalitis por herpes simple y esta enfermedad 
destruye principalmente las zonas temporales media e inferior. En cambio, la mayoría de los 
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pacientes con trastorno específico para los objetos inanimados han sufrido una lesión en la 
zona frontoparietal izquierda. 

Palabras irregulares frente a palabras regulares. Algunos pacientes son incapaces de leer las 
palabras irregulares (cuya pronunciación no puede deducirse de las letras escritas) y, en 
cambio, no tienen dificultad para leer las palabras regulares aunque sean desconocidas o 
incluso inexistentes (seudopalabras). Otros pacientes, por el contrario, leen sin dificultad las 
palabras irregulares pero no consiguen leer las seudopalabras. Generalmente, los pacientes 
con dificultades para leer las palabras irregulares tienen dañada la vía ventral (la que va del 
área occipital a la frontal a través de la zona temporal inferior), y los que presentan 
dificultades para leer las seudopalabras tienen dañada la vía dorsal (la que va desde el área 
occipital a la frontal a través de la zona temporoparietal). 


Con esta metodología de la disociación doble se publicaron numerosos casos de pacientes que 
obligaron a reformular muchos de los modelos de procesamiento lingiiístico existentes. 
Algunos de esos modelos desaparecieron y otros tuvieron que modificarse para poder encajar 
los nuevos datos que iban surgiendo desde la neuropsicología cognitiva. Por otra parte, con los 
modelos cada vez más desarrollados podían hacerse predicciones sobre posibles trastornos que 
no se habían descrito. Así, con el modelo de doble ruta que había servido para interpretar las 
dislexias visual, superficial y profunda se pronosticaba un nuevo trastorno disléxico como 
consecuencia de afectación de la vía subléxica cuya principal dificultad sería la lectura de 
palabras desconocidas y palabras de baja frecuencia. Efectivamente, poco después Beauvois y 
Derouesné (1979) publicaron un caso con estas características y denominaron al trastorno 
dislexia fonológica. 

Esta manera de estudiar los trastornos del lenguaje tiene, por lo tanto, un gran interés teórico 
como forma de poner a prueba las teorías y los modelos lingúísticos. No en vano muchos de 
los modelos y teorías actuales están basados en datos empíricos obtenidos de pacientes 
afásicos más que de individuos sanos. Pero también tiene aplicaciones prácticas, ya que 
permite conocer con detalle los trastornos de los pacientes y, sobre todo, entender sus causas, 
lo que posibilita la elaboración de programas de rehabilitación adecuados a los pacientes. En 
consecuencia, al amparo de estos estudios se ha ido desarrollando una importante corriente de 
evaluación y tratamiento de los trastornos del lenguaje con unos resultados muy alentadores. 
De hecho, la rehabilitación de los trastornos del lenguaje ha experimentado grandes avances 
en los últimos años gracias a este enfoque (Cuetos, 1998). 

En definitiva, el estudio de los trastornos afásicos es una parte importante de la psicología del 
lenguaje, puesto que los modelos de procesamiento lingúístico sirven para interpretar los datos 
de los pacientes y estos datos sirven para probar y refinar esos modelos. En consecuencia, en 
este capítulo describiremos los principales trastornos producidos por lesión cerebral, pero no 
nos centraremos en la clásica tipología de trastornos afásicos que aparecen en los manuales 
(afasia de Broca, afasia de Wernicke, afasia de conducción, etc.), sino en los trastornos 
específicos que se producen como consecuencia de la alteración de alguno de los componentes 
del sistema lingitístico. No importa que el trastorno en cuestión constituya un síntoma típico de 
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algún síndrome (p. ej., los trastornos fonológicos en la afasia de Wernicke o las dificultades en 
la repetición en la afasia de conducción) o que se trate de un síntoma aislado (p. ej., la 
incapacidad de leer palabras irregulares o la dificultad para nombrar seres vivos), ya que cada 
síntoma requiere una explicación basada en los modelos de procesamiento lingúístico. Es 
decir, de lo que se trata es de explicar cada uno de los síntomas que presenta cada paciente, con 
independencia del síndrome en el que se lo pueda encuadrar. Lo realmente importante es 
entender por qué un paciente es incapaz de repetir seudopalabras y, en cambio, repite 
perfectamente las palabras o por qué otro paciente es incapaz de leer las palabras irregulares y 
en cambio lee sin dificultad las palabras regulares. 

En primer lugar analizaremos los trastornos del lenguaje oral: los de comprensión y después 
los de producción. Comenzaremos por los que se producen en un ámbito más perceptivo por 
dificultades en la percepción de los fonemas (agnosias auditivas), para continuar con los del 
ámbito léxico y semántico. En los trastornos de producción seguiremos el proceso inverso, 
comenzando por los más centrales semántico y léxico (anomias) hasta terminar en los más 
periféricos que se producen por trastorno en los programas motores. A continuación 
describiremos los trastornos del lenguaje escrito, tanto en lectura (dislexias) como en escritura 
(disgrafias), y luego los trastornos semánticos y los trastornos que se producen en el 
procesamiento de las oraciones y los discursos. Finalmente nos ocuparemos de las demencias 
neurodegenerativas con objeto de comprobar cómo se va desintegrando el sistema de 
procesamiento lingúístico como consecuencia de la destrucción paulatina del cerebro. Nos 
detendremos en los tres tipos de demencias más comunes, la enfermedad de Alzheimer, la 
enfermedad de Parkinson y las demencias frontotemporales. Por último, dedicaremos un 
apartado a la evaluación del lenguaje. 


TRASTORNOS DEL LENGUAJE ORAL 

Tradicionalmente, los trastornos del lenguaje oral se dividían en dos grandes síndromes: la 
afasia de Broca, que englobaba los trastornos de producción, y la afasia de Wernicke, que 
incluía los de comprensión. Esta clasificación no es ni mucho menos perfecta, dado que 
muchos pacientes con afasia de Broca tienen también problemas de comprensión, y muchos 
afásicos de Wernicke tienen problemas de producción. Por otra parte, es difícil encontrar 
pacientes que presenten todos los síntomas de un determinado síndrome (p. ej., son pocos los 
pacientes que cumplen todos los síntomas de la afasia de Broca). De lo que se trata, por lo 
tanto, es de explicar cada síntoma del paciente según los modelos de comprensión y 
producción, con independencia del síndrome en el que se pudiera incluir. Por otra parte, los 
modelos predicen determinados síntomas cuando alguno de sus componentes deja de 
funcionar total o parcialmente. Es obvio que si se daña el mecanismo de conversión 
acústico-fonológico los pacientes serán incapaces de repetir seudopalabras porque ese es el 
único proceso capaz de realizar esa función, o si se debilita el acceso al léxico fonológico el 
paciente presentará trastornos anómicos. 
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e Trastornos de comprensión 

La primera operación que nuestro sistema de percepción del habla realiza es la identificación 
de los fonemas. El análisis de los rasgos articulatorios de los sonidos (si se trata de un sonido 
oclusivo, bilabial, sonoro, etc.), junto con otros factores como los movimientos de los labios, 
el contexto, etc., como se describió en el capítulo 5, permite identificar los fonemas. Algunos 
pacientes, como consecuencia de una lesión cerebral en la circunvolución superior del lóbulo 
temporal izquierdo, en la zona comprendida entre el área auditiva primaria y el área de 
Wernicke, tienen dificultades para identificar los fonemas y, consecuentemente, para 
comprender el habla. A este trastorno se lo conoce como sordera verbal pura o también 
sordera específica para las palabras, ya que sus dificultades se limitan a los sonidos del habla. 
Estos pacientes pueden identificar los sonidos ambientales (el ladrido de un perro, el ruido de 
un motor, etc.) e incluso perciben perfectamente las características físicas del lenguaje, y así 
saben si el que habla es un hombre o una mujer, si está hablando en su lengua nativa o en un 
idioma extranjero, si tiene una voz aguda o grave o si es una persona conocida o desconocida, 
aunque no entiendan nada de lo que está diciendo. Dependiendo de la gravedad del trastorno, 
algunos pacientes sólo tienen dificultades para identificar ciertos fonemas, mientras que otros 
tienen graves problemas perceptivos generales, pero todos tienen en común que, si se les habla 
despacio y articulando bien los sonidos, su percepción mejora notablemente. También les 
ayuda el hecho de ver la cara de la persona que habla, porque se sirven en buena medida de la 
lectura labial, de ahí que sus dificultades sean aun más acusadas cuando intentan escuchar la 
radio o hablar por teléfono. 

Cuando la lesión afecta al proceso de reconocimiento de las palabras el trastorno se conoce con 
el nombre de sordera para la forma de la palabra. Estos pacientes identifican correctamente 
los fonemas, pero no son capaces de reconocer las palabras. De hecho, no distinguen cuando se 
trata de una palabra real o inventada (fallan en la tarea de decisión léxica auditiva), pero eso no 
les impide poder repetir tanto las palabras como las seudopalabras, ya que utilizan la vía 
subléxica o mecanismo de conversión acústico-fonológico. Este mecanismo es el que les 
permite también escribir al dictado aunque no sepan lo que están escribiendo. La lesión 
causante de parte superior del lóbulo temporal izquierdo, aunque en una zona más posterior, en 
el área de Wernicke. 

Un tercer tipo de trastorno perceptivo es la sordera para el significado de las palabras. Se 
denomina así porque los pacientes son capaces de identificar los fonemas e incluso de 
reconocer las palabras, pero no consiguen acceder a su significado. Saben si una palabra es 
familiar o no y distinguen las palabras de las seudopalabras, pero no las comprenden. De 
acuerdo con los modelos de procesamiento léxico, estos pacientes consiguen acceder al léxico, 
por eso reconocen las palabras y hacen bien la tarea de decisión léxica, pero no logran acceder 
al sistema semántico y, por lo tanto, no saben qué significan las palabras aunque éstas les 
resulten familiares, al menos por la vía oral, porque si se le presentan esas mismas palabras de 
forma escrita los pacientes no tienen dificultad alguna para leerlas y entenderlas. En 
determinados estudios se han descrito pacientes que no conseguían entender las palabras que 
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se les decían, pero cuando se les pedía que las escribiesen, inmediatamente después de 
escribirlas las leían y las comprendían sin dificultad. Hace ya muchos años que se describió el 
primer caso de sordera para el significado de las palabras, cuando Bramwell en 1897 relató el 
curioso caso de una joven que después de haber sufrido un accidente tenía un tipo de conducta 
«muy extraña», puesto que hablaba, leía y escribía correctamente pero no entendía el habla. 
Sin embargo, cuando escribía las palabras que no conseguía entender y leía lo escrito las 
comprendía al instante. La interpretación de este trastorno es que la lesión ha dañado la 
conexión entre el léxico auditivo y el sistema semántico, por lo que los pacientes acceden sin 
dificultad al léxico y, por consiguiente, reconocen las palabras pero no pueden llegar hasta el 
significado. Sin embargo, sí pueden llegar al significado desde otras vías, como la visual, 
debido a que el sistema semántico está intacto (Recuadro 12-2). 


Recuadro 12-2. Sordera para el significado de las palabras 


H.N. tenía 53 años cuando un día, de manera repentina, perdió el habla. El estudio de neu- 
roimagen mostró una lesión en el área de Wernicke que se extendía a las circunvoluciones an- 
gular y supramarginal. Dos meses después, cuando se realizó la evaluación, presentaba un perfil 
de afasia de Wernicke con trastornos de comprensión y habla fluida, aunque con algunos errores 
fonológicos y semánticos. 


Al realizar la prueba de identificación de las partes del cuerpo se comprobó una sordera para 
el significado de las palabras. De un total de 15 partes del cuerpo que H.N. tenía que señalar 
cuando se le pronunciaba el nombre, señaló bien 13 pero falló en 2: rodilla y pelo. Con estos dos 
ítems H.N. parecía estar confuso, pues los repetía correctamente pero no sabía qué parte debía 
señalar. Cuando se le pidió que escribiese esos nombres, lo hizo correctamente, los leyó e inme- 
diatamente señaló las partes del cuerpo a las que correspondían. 


En otra sesión se le mostró la lámi- 
na «Robo de galletas» del test de Boston 
(Fig. 12-1) y se le nombraron 12 objetos 
de la lámina para que los señalase. H.N. 
señaló rápidamente y sin dificultad 9 de 
ellos, pero con tres (taza, fregadero y es- 
tantería) se mostró sorprendido sin saber 
a qué se referían. Así, cuando se le pidió 
que señalase la taza, H.N. dijo: «taza, 
taza, T-A-Z-A, taza, ¿qué est. Después 
se le pidió que escribiese la palabra, 
entonces en cuanto la hubo escrito, la 
leyó y dijo «oh, taza», e inmediatamente 
señaló la taza en la lámina. Lo mismo 
ocurrió con el fregadero y la estantería. — Figura 12-1. Lámina «Robo de galletas» del test de Boston. 


Otro tipo de trastorno, cuyo único síntoma es la dificultad para repetir palabras de baja 
frecuencia y seudopalabras, se denomina agnosia fonológica. Los pacientes con este trastorno 
reconocen las palabras familiares y acceden a su significado, pueden repetirlas y escribirlas al 
dictado. Sin embargo, no pueden repetir ni tampoco escribir al dictado las palabras 
desconocidas. La interpretación que se hace de este trastorno es que la lesión ha dañado la vía 
subléxica y que la vía léxica sólo funciona con las palabras representadas en el léxico. 

No obstante, de todos los trastornos de comprensión, el más grave y, a la vez, más llamativo es 
la disfasia profunda. Los pacientes que sufren disfasia profunda tienen problemas serios de 
comprensión y repetición de palabras. Suelen presentar varios síntomas, como dificultades 
para repetir palabras de baja frecuencia, mayor dificultad para repetir palabras abstractas que 
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concretas, mayor dificultad para repetir verbos que nombres, graves dificultades para repetir 
palabras funcionales o mayor dificultad para repetir palabras morfológicamente compuestas 
que palabras simples. Pero los dos síntomas más llamativos son la incapacidad total para 
repetir seudopalabras y la producción de errores semánticos en repetición (Michel y 
Andreewsky, 1983). Por ejemplo, un paciente decía «amarillo» cuando se le pedía que 
repitiese «rojo» o «globo» cuando se le decía «cometa». La explicación de este trastorno es 
que la lesión ha dañado varios componentes del sistema de procesamiento léxico. Por una 
parte, ha destruido totalmente la vía subléxica, y ésta es la causa por la que son incapaces de 
repetir seudopalabras, y, por otra, ha dañado parcialmente la vía léxico-semántica, por lo que 
los pacientes consiguen activar parcialmente el sistema semántico pero no siempre 
seleccionan el concepto adecuado. A veces seleccionan otro concepto relacionado que puede 
estar más accesible y por ello cometen el error semántico. Al no funcionar la vía subléxica no 
pueden comprobar si han repetido bien. Por las mismas razones, tienen más dificultades para 
repetir palabras abstractas o funcionales porque éstas tienen menor representación semántica. 
e Trastornos de producción 
Los trastornos de producción oral también son variados, puesto que son muchos los procesos 
que intervienen en el habla, y cada uno de ellos depende de diferentes sustratos neuronales, 
todos susceptibles de ser lesionados. En términos generales se habla de anomia cuando el 
paciente tiene dificultades para recuperar las palabras que trata de utilizar en su discurso oral y 
dichas dificultades no se deben a problemas motores. Según el mecanismo concreto 
responsable del trastorno se distinguen varios tipos de anomias. 
Cuando el problema se debe a que el paciente no consigue activar el significado o la 
representación conceptual se habla de anomia semántica. Los pacientes con anomia semántica 
tienen un discurso pobre, vacío de contenidos por su dificultad de activar los conceptos. 
También presentan problemas de comprensión, especialmente para los conceptos poco 
familiares, ya que el sistema conceptual o semántico es común para la comprensión y la 
producción y para todas las modalidades sensoriales. Estos pacientes fallan, por lo tanto, en 
tareas que exigen acceder al significado, como la de emparejamiento palabra-dibujo, en la que 
se le presentan varios dibujos para que señale uno determinado; en la de emparejamiento 
definición-palabra, en la que se le dice una definición y se le presentan varias palabras para que 
elija la que se ajusta a la definición, o en la denominación de dibujos. Los errores en la 
denominación de dibujos y en el habla espontánea son principalmente semánticos, puesto que 
tienen dificultades para distinguir entre conceptos similares (p. ej., entre «tigre» y «león» o 
entre «bolígrafo» y «lápiz»). La anomia semántica suele estar causada por lesiones en las 
zonas temporal y frontotemporal del hemisferio izquierdo, que es por donde se extienden las 
redes neuronales correspondientes a los conceptos. 
En otros casos los pacientes acceden a los conceptos, pero tienen dificultades para recuperar el 
nombre de esos conceptos (Cuetos, Agudo y Caramazza, 2000). Saben perfectamente lo que 
quieren decir pero no encuentran la palabra para expresarlo. Es como si estuviesen cayendo 
continuamente en el molesto estado de «tenerlo en la punta de la lengua». A este trastorno se lo 
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conoce como anomia pura (Recuadro 12-3). Su habla se caracteriza por el uso masivo de 
circunloquios, es decir, tratan de explicar la palabra que no consiguen recordar (p. ej., «es para 
barrer» para referirse a «escoba») y también por el uso de términos genéricos («cosa», 
«bicho», «animal», etc.). 


Recuadro 12-3. Anomia pura 

D.P. era profesor universitario hasta que sufrió un accidente cerebrovascular a los 47 años de 
edad. Aunque sus funciones cognitivas (atención, memoria, etc.) no se vieron afectadas, 
sufrió trastornos del lenguaje, en concreto, trastornos anómicos. Tenía graves dificultades 
para nombrar objetos o dibujos de objetos y, de hecho, obtuvo una baja puntuación en el test 
de vocabulario del Boston, en el que se presentan 60 dibujos para que el paciente los nombre. 
También puntuaba bajo en las tareas de fluidez verbal, en las que debía decir palabras de una 
determinada categoría durante un minuto. Su lenguaje espontáneo era gramaticalmente 
correcto, aunque con abundantes circunloquios, anomias y algunas perseveraciones. En 
cambio, su comprensión oral, así como la lectura y la escritura estaban conservadas. 

Para conocer las causas de su anomia, se presentaron a D.P. 140 dibujos simples de objetos 
familiares y animales comunes (p. ej., lámpara, percha, tigre, etc.) en tarjetas individuales. 
D.P. nombró correctamente 92, lo que supone un 66 %/o de aciertos. La mayoría de sus errores 
eran de tipo semántico; así al «tigre» lo llamó «león»; a la «luna», «sol», y a la «zanahoria», 
«perejil». También hizo varios circunloquios, errores morfológicos (p. ej., «regador» por 
«regadera») y perseveraciones (volver a decir una palabra que ya había dicho previamente y 
que no tenía relación con el estímulo actual). 

Las variables que determinaban la ejecución de D.P. eran fundamentalmente la frecuencia de 
las palabras y la edad de adquisición, lo que significa que las probabilidades de que D.P. 
nombrase correctamente un dibujo aumentaban de forma considerable cuando ese dibujo 
tenía un nombre de alta frecuencia y fue aprendido en una etapa temprana de la vida. 

Los problemas anómicos de D.P. no se producían a nivel semántico, ya que no presentaba 
dificultad alguna con los significados y, aunque no encontraba las palabras, sabía 
perfectamente lo que querían decir. De hecho, realizó bien la tarea de asociación semántica 
consistente en emparejar los ítems relacionados y también la tarea de emparejamiento 
palabra-dibujo consistente en señalar entre varios dibujos el que le nombraba el 
neuropsicólogo. 

Sus problemas tampoco eran de tipo fonológico, puesto que realizaba perfectamente las tareas 
de repetición de palabras y de seudopalabras, así como la de lectura en voz alta que exigen la 
recuperación de los fonemas de las palabras. 

Se trataba, por lo tanto, de un caso típico de anomia pura en la que los problemas para recu- 
perar las palabras se debían exclusivamente a una dificultad para acceder al léxico fonológico, 
probablemente porque la lesión produjo una disminución del nivel de activación que permitía 
todavía el acceso a las palabras con umbral bajo (las de alta frecuencia y adquiridas temprana- 
mente) pero no a las de umbral alto. 
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Sus construcciones gramaticales son correctas y con las palabras funcionales adecuadas, pero 
tienen escasas palabras de contenido, especialmente los mombres. Las variables más 
determinantes de su ejecución son la frecuencia y la edad de adquisición de las palabras: sólo 
recuerdan las palabras de más alta frecuencia y adquiridas en edad más temprana. 
Generalmente les sirve de gran ayuda que se les digan los primeros fonemas de la palabra que 
no recuerdan. La anomia pura puede estar causada por lesiones en cualquier zona del cerebro, 
de hecho, es uno de los síntomas que suele estar presente en todos los trastornos anómicos, 
aunque fundamentalmente se produce cuando la lesión afecta al temporal izquierdo. 

También puede ocurrir que el paciente sea capaz de recuperar la palabra que busca pero tenga 
dificultades para seleccionar los fonemas de esa palabra, ya que para una correcta 
pronunciación de una palabra es necesario activar todos los fonemas que la componen y en el 
orden correcto. Algunos pacientes tienen el trastorno en el procesamiento fonológico y por 
ello cometen errores de omisión, sustitución, adición, intercambios, etc., de fonemas (p. ej., 
«armanio» por «armario», «cabalozo» por «calabozo» o «catel» por «cartel»). A este trastorno 
se lo denomina anomia fonológica (Ellis, Miller y Sin, 1983). A veces, los pacientes producen 
tanta distorsión en la palabra que tratan de decir que ésta no se parece a ninguna conocida; es lo 
que se conoce con el nombre de «neologismo». Los pacientes con anomia fonológica 
presentan no sólo el trastorno en el lenguaje espontáneo y en tareas como la denominación de 
dibujos, sino también en las tareas de lectura en voz alta y en repetición, debido a que el 
proceso de selección de los fonemas interviene en todas las actividades de producción oral. La 
variable más determinante de la ejecución de estos pacientes es la longitud, pues cuanto más 
larga es una palabra más fonemas tienen que seleccionar y mayores son las posibilidades de 
equivocarse. 

Finalmente, existen trastornos motores que se producen cuando la lesión afecta a la capacidad 
de programar y ejecutar las órdenes dirigidas a los músculos responsables de la articulación de 
los sonidos del habla. En este caso se habla de apraxia del habla. Estos pacientes no tienen 
dañados los músculos encargados de la articulación, sino los programas que deberían enviar 
las órdenes a esos músculos. Estos pacientes también suelen cometer errores de sustitución, 
omisión, etc., de fonemas, pero no por confusión, sino por fallo en la ejecución de la orden. De 
hecho, a veces emiten un sonido más fácil de pronunciar en lugar de otro más complejo. La 
apraxia del habla se produce por lesión en el lóbulo frontal izquierdo. 


TRASTORNOS DEL LENGUAJE ESCRITO 
e Dislexias 

Los trastornos de lectura se denominan dislexias y se distinguen dos tipos: dislexias 
evolutivas, cuando se refieren a dificultades en el aprendizaje de la lectura, y dislexias 
adquiridas, cuando son producidas como consecuencia de una lesión cerebral. De manera 
similar, los trastornos de escritura se denominan disgrafias y también se distingue entre 
evolutivas y adquiridas. En el caso de las evolutivas, las dislexias y disgrafias suelen 
aparecer juntas, ya que los niños con dificultades para aprender a leer también tienen 
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dificultades para aprender a escribir, puesto que, en realidad, se trata de la misma operación en 
sentido inverso: conversión de grafemas en fonemas en la lectura y de fonemas en grafemas en 
la escritura. En cambio, las dislexias y disgrafias adquiridas pueden manifestarse 
independientemente, dado que hay pacientes que sufren trastornos de escritura y mantienen la 
lectura (agrafía pura) y pacientes que no pueden leer lo que acaban de escribir (alexia pura). 
Esto sucede porque la lectura y la escritura dependen de áreas cerebrales diferentes, que 
pueden resultar dañadas de manera independiente. 

Las dislexias adquiridas han sido muy investigadas. No en vano el enfoque de la 
neuropsicología cognitiva comenzó con este tipo de trastornos, debido a que desde hace años 
se dispone de modelos de lectura muy precisos que permiten explicar cualquier tipo de 
trastorno disléxico. Por otra parte, los trastornos disléxicos se han utilizado como argumento 
en la polémica entre los modelos de lectura, principalmente el modelo dual y el modelo de 
triángulo, explicados en el capítulo 11, y en un principio los tipos de dislexia encontrados 
parecían apoyar más al modelo dual que tenía una explicación muy clara para los diferentes 
trastornos, aunque posteriores reformulaciones del modelo de triángulo permitieron a este 
modelo encajar también los datos. 

Al explicar el sistema de procesamiento de la lectura en el capítulo 11, describimos una serie 
de procesos perceptivos destinados a la identificación de las letras y las palabras. Pues bien, 
cuando la lesión cerebral afecta a las áreas responsables de esos procesos se producen las 10 
denominadas dislexias periféricas, que en algunos casos afectan no sólo a la lectura, sino 
también a la percepción visual de los objetos. Entre estas dislexias periféricas se incluyen la 
dislexia por negligencia, cuando los pacientes cometen errores de lectura porque no prestan 
atención a una parte de la palabra, la dislexia atencional cuando los pacientes parecen 
incapaces de atender a todas las letras ya que identifican bien las letras individuales pero 
cometen errores cuando tienen que leer palabras, o la dislexia visual, cuyo principal síntoma 
reside en los errores de tipo visual (p. ej., «camino» por «canino»). 

La dislexia periférica más conocida es la alexia pura o lectura letra a letra. Recibe el nombre 
de alexia pura porque suele presentarse sin ningún otro tipo de trastorno lingiístico, ni siquiera 
de escritura. El nombre de lectura letra a letra se debe a que estos pacientes identifican bien las 
letras que forman la palabra pero les cuesta leer la palabra completa, por lo que hacen una 
lectura muy serial letra a letra de izquierda a derecha. En los casos más graves tienen que leer 
en voz alta las letras de las palabras para poder entenderlas, de ahí el nombre de lectura letra a 
letra; así, para leer la palabra «jamón» dirían: «jota, a, eme, o, ene... jamón». Esto hace que su 
lectura sea muy lenta y trabajosa, especialmente con las palabras largas, con las que pueden 
tardar varios minutos. Las lesiones causantes de alexia pura suelen situarse entre el lóbulo 
occipital y el temporal en el hemisferio izquierdo, en torno al área de la «forma de la palabra» 
descrita en el capítulo 11. 

Cuando la lesión afecta a los procesos de reconocimiento de palabras se habla de dislexias 
centrales. Estos pacientes no tienen ningún tipo de trastorno perceptivo y, de hecho, 
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identifican perfectamente las letras, siendo los problemas de tipo lingúístico. Los tres tipos de 
dislexias centrales más conocidas son fonológica, superficial y profunda. 

La dislexia fonológica se caracteriza por la dificultad que tienen los pacientes para leer 
palabras desconocidas y seudopalabras (Beauvois y Derouesné, 1979). No presentan 
problemas con las palabras familiares, pero a medida que disminuye la familiaridad de las 
palabras se reducen las probabilidades de leerlas correctamente. Los tipos de errores más 
frecuentes que cometen estos pacientes son los visuales cuando leen palabras, es decir, 
confunden algunas palabras por otras de parecido visual (p. ej., «trompa» por «trampa»), y las 
lexicalizaciones cuando leen seudopalabras, esto es, transforman las seudopalabras en 
palabras (p. ej., pueden leer «caballo» donde dice «catallo»). 

De acuerdo con el modelo dual, la dislexia fonológica se produce porque la lesión daña la vía 
subléxica, que es fundamental para la lectura de palabras de baja frecuencia y palabras des- 
conocidas. En consecuencia, los pacientes sólo pueden utilizar la vía léxica, que es útil para las 
palabras familiares, pero no les sirve para aquellas palabras de las que no disponen de 
representaciones ortográficas. En su intento de leer las palabras desconocidas activan las 
representaciones ortográficas de otras palabras parecidas, produciéndose los errores visuales, 
si se trata de palabras, o las lexicalizaciones, si se trata de seudopalabras. El grado de 
alteración lectora que presentan los disléxicos fonológicos depende, de acuerdo con el modelo 
dual, del número de reglas grafema-fonema dañadas, ya que pueden estar afectadas unas pocas 
o todas ellas, y de la experiencia lectora que tuviese el paciente antes de la lesión, pues cuanto 
más experto fuese, más palabras tendría representadas en su léxico y podría acceder 
directamente a ellas. Si un lector poco experto, con pocas representaciones ortográficas y que 
basa su lectura en las reglas grafema-fonema, sufre una lesión que daña ese mecanismo 
subléxico, tendrá muy afectada su lectura, ya que se limitará a unas pocas palabras. Para el 
modelo conexionista de triángulo, la interpretación de este trastorno es que se ha dañado la 
conexión entre las unidades ortográficas y fonológicas, con lo cual sólo pueden leer a través de 
la semántica que, de nuevo, sólo es útil para las palabras familiares. 

Por el contrario, la dislexia superficial se caracteriza por la dificultad para leer palabras 
irregulares. Los disléxicos superficiales no tienen problema con las palabras de ortografía 
regular, sean familiares o desconocidas, ni tampoco con las seudopalabras, pero no consiguen 
leer las palabras que no se ajustan a las reglas de conversión grafema-fonema. El error más 
común cuando tienen que leer esas palabras es la regularización, por lo que la pronunciación 
que le dan a la palabra no se corresponde con ella y, por lo tanto, no la comprenden. Uno de los 
casos más extremos de dislexia superficial en inglés es el del paciente K.T., descrito por 
McCar-thy y Warrington (1986), que sólo era capaz de leer el 47% de las palabras irregulares, 
mientras que leía correctamente el 100% de las regulares de la misma frecuencia. En 
castellano la dislexia superficial suele pasar inadvertida debido a que no existen palabras con 
ortografía irregular; únicamente se detecta con las palabras extranjeras de uso cada vez más 
común y en las que se mantienen la forma y la pronunciación, por ejemplo, 'Hollywood", 
'google', 'Facebook' o 'Peugeot'. También se observa cuando, además de la precisión, se tienen 
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en cuenta las latencias de lectura, ya que sus tiempos son considerablemente más lentos, sobre 
todo cuando se trata de leer palabras largas. 

Para el modelo dual la dislexia superficial se produce porque se encuentra afectada la vía 
léxica y, en consecuencia, los pacientes tratan de leer todas las palabras por la vía subléxica, 
que funciona con las palabras regulares pero no con las irregulares. Una prueba de que los 
pacientes leen por la vía subléxica es que la longitud de las palabras influye considerablemente 
sobre sus latencias de lectura: cuanto más larga es una palabra, más tiempo tardan en leerla. 
Esto se debe -según el modelo dual- a que la aplicación de las reglas de conversión 
grafema-fonema se realiza de manera serial de izquierda a derecha y, cuantas más letras tiene 
una palabra, mayor número de reglas hay que aplicar y los tiempos se van acumulando. Según 
el modelo conexionista la dislexia superficial se produce cuando se daña la vía semántica y, 
por lo tanto, según este modelo, todos los disléxicos superficiales tienen también problemas 
semánticos. 

Finalmente, la dislexia profunda es la más compleja y la más grave de las tres formas de 
dislexias centrales (Recuadro 12-4). 


Recuadro 12-4. Dislexia profunda 


P.R. era una joven de 23 años con una licenciatura universitaria que sufrió un traumatismo 
craneoencefálico a causa de un accidente de moto. Una de las muchas secuelas del grave acci- 
dente fue la dislexia profunda. P.R. podía leer muchas de las palabras que se le presentaban, 
pero era incapaz de leer una sola seudopalabra. 

Su ejecución con las palabras dependía fundamentalmente de la frecuencia, la imaginabilidad 
y la clase gramatical: leía bien las palabras de alta frecuencia, pero fallaba con las de 
frecuencia baja. Leía mejor las palabras de alta imaginabilidad que las de baja imaginabilidad 
y mejor los sustantivos que los verbos o las palabras funcionales. 

Sus errores al leer palabras eran de distintos tipos. A veces eran errores visuales (p. ej., leía 
«tráfico» en vez de «trágico» o «caliente» en vez de «cliente») o derivativos (p. €j., 
«repetición» por «repetir»). Muchas veces decía que no era capaz de leer esa palabra. No 
obstante, los errores más llamativos eran los semánticos: leía «oro» ante la palabra «plata», 
«pizarra» por «borrador» o «pelo» por «cepillo». 

Un año y medio después de la primera evaluación, período en el que siguió un tratamiento 
logopédico para mejorar su anomia y problemas de lectura, P.R. fue evaluada de nuevo y ya 
era Capaz de leer la mayoría de las palabras y un gran número de las seudopalabras. Además, 
ya no cometía errores semánticos, porque en el momento en que los pacientes disléxicos 
comienzan a aplicar de nuevo las reglas de conversión grafema-fonema, empiezan a leer las 
seudopalabras y automáticamente dejan de cometer errores semánticos. 


Los dos síntomas principales son la incapacidad para leer seudopalabras y palabras 
desconocidas y la comisión de errores semánticos (Coltheart, Patterson y Marshall, 1980). Al 
igual que los disléxicos fonológicos, tienen dificultades para leer las seudopalabras, pero 
mientras que los fonológicos consiguen leer algunas, los disléxicos profundos son incapaces 
de leer una sola seudopalabra. Además, son muy llamativos los errores semánticos 
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consistentes en sustituir la palabra que tienen que leer por otra con la que no guarda ninguna 
relación visual pero sí semántica, por ejemplo, leen «cuerpo» por «vida» o «monte» por 
«valle». Otros síntomas que también suelen caracterizar la dislexia profunda son: mayor 
dificultad para leer las palabras abstractas que las concretas, mayor dificultad con las palabras 
funcionales que con las de contenido o mayor dificultad para leer verbos que nombres. 
Además de los errores semánticos, que son los más llamativos, también cometen errores 
visuales. 
Para el modelo de doble ruta, los síntomas de la dislexia profunda se producen porque está 
totalmente dañada la vía subléxica, lo que impide leer las seudopalabras, y parcialmente 
dañada la vía lexicosemántica, lo que origina los restantes síntomas (mayor dificultad con las 
palabras funcionales que con las de contenido porque carecen de representación semántica o 
con las abstractas que con las concretas por la menor riqueza de las conexiones semánticas). 
En cuanto a los errores semánticos, se producen porque a veces el paciente no consigue activar 
la palabra exacta pero logra activar otra relacionada y generalmente de mayor frecuencia (p. 
ej., «perro» en vez de «lobo»). Esos errores no se producirían si funcionase la vía subléxica, 
porque la información procedente de esta vía permitiría al paciente darse cuenta de su error. 
De hecho, los errores semánticos sólo se producen cuando los pacientes tienen completamente 
dañada la vía subléxica, como indica su total incapacidad para leer seudopalabras. Para el 
modelo de triángulo es la conexión ortografía-fonología la que ha resultado dañada por la 
lesión y, parcialmente, la representación semántica. 
Por otra parte, en función del componente de la vía lexicosemántica que resulta dañado, se 
distinguen varios subtipos de dislexia profunda (Cuetos, 2008): dislexia profunda de input 
cuando el daño afecta al léxico visual, dislexia profunda central cuando afecta al sistema 
semántico y dislexia profunda de output cuando afecta al léxico fonológico. Los síntomas 
principales son similares en los tres casos, aunque por razones diferentes. En la dislexia de 
input los problemas surgen ya en el reconocimiento de las palabras y, si no se reconoce 
correctamente una palabra, no es posible acceder al significado que le corresponde. Estos 
pacientes fallan en la tarea de decisión léxica. En la dislexia central los problemas se producen 
en el sistema conceptual o semántico, por lo que existen dificultades en cualquier tarea que 
exija acceder al significado de las palabras sea de forma escrita o de forma oral. En la dislexia 
de output el daño se produce en el léxico fonológico, por lo que los pacientes reconocen la 
palabra que están leyendo, pero acceden a una pronunciación que no les corresponde. De 
hecho, muchas veces se dan cuenta de que la están leyendo mal (ante la palabra escrita 
«miércoles» un paciente decía «jueves,... pero no»). Los disléxicos de output son asimismo 
anómicos, puesto que su trastorno se produce en el léxico fonológico, en la capacidad para 
recuperar las palabras. 

e Disgrafias 
También las disgrafias adquiridas se dividen en dos grupos: centrales, cuando el trastorno 
afecta al procesamiento léxico, y periféricas, cuando afecta a los componentes posléxicos y 
motores (Ellis, Young y Flude, 1987). Las disgrafias centrales han sido las más estudiadas, 
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como forma de poner a prueba los modelos léxicos de escritura, y, al igual que en las dislexias, 
se distinguen tres tipos de disgrafias: fonológica, superficial y profunda. 

Los pacientes con disgrafía fonológica tienen dificultades para escribir al dictado palabras 
desconocidas y seudopalabras, pero, en cambio, escriben bien las palabras familiares. Cuanto 
más frecuente es una palabra, más posibilidades existen de que el paciente la escriba 
correctamente. Muchos de los errores que cometen son lexicalizaciones, es decir, convertir las 
seudopalabras que se les dictan en palabras (p. ej., escribir «broma» cuando se les dicta 
«bropa»); otras veces son errores en alguno de los grafemas (p. ej., escribir «maldena» cuando 
se le dicta «malfena). Algunos pacientes cometen pocos errores y sólo con determinados 
grafemas, mientras que otros cometen numerosos errores. Lo que todos tienen en común es 
que cometen muchos más errores con las seudopalabras que con las palabras. Así, un paciente 
descrito por Shallice (1981) escribía correctamente el 94 % de las palabras y sólo el 18 % de 
las seudopalabras. Por otra parte, los trastornos no son de tipo motor, ya que las dificultades 
con las seudopalabras no sólo aparecen en la escritura a mano, sino también cuando se le pide 
al paciente que escriba en el ordenador. 

La explicación de la disgrafia fonológica desde el modelo dual de escritura es que se ha 
producido un daño en la vía subléxica que impide el funcionamiento del mecanismo de 
conversión fonema-grafema. En consecuencia, el paciente únicamente puede utilizar la vía 
léxica, pero ésta sólo sirve para aquellas palabras de las que el paciente tiene representación 
léxica, de ahí que sólo pueda escribir las palabras frecuentes. 

A los pacientes con disgrafia superficial les ocurre exactamente lo contrario: escriben 
correctamente tanto las palabras conocidas como las desconocidas e incluso las seudopalabras, 
siempre que sean regulares, pero tienen dificultades con las palabras de ortografía arbitraria. 
Un paciente descrito por Beauvois y Derouesné (1981) escribía correctamente el 99 % de las 
seudopalabras y sólo el 36 % de las palabras irregulares. Los errores que generalmente 
cometen son de tipo ortográfico. 

Desde el modelo dual de escritura se interpreta este trastorno como afectación de la vía léxica, 
por lo que los pacientes pueden seguir utilizando el mecanismo de conversión 
fone-ma-grafema que funciona en las palabras regulares, pero no en las irregulares que 
requieren el acceso al léxico. 

Si bien en castellano, como se ha señalado, los pacientes con dislexia superficial pueden pasar 
inadvertidos porque en la lectura hay una gran regularidad (podemos leer cualquier palabra 
aunque nunca la hayamos visto, debido a que todas se ajustan a las reglas de conversión 
grafema-fonema), en la escritura no hay tal regularidad, puesto que varios fonemas se pueden 
escribir con grafemas diferentes (b/v, g/j, y/ll, etc.), por lo que muchas palabras sólo podrán 
escribirse correctamente si se dispone de representación ortográfica (abeja, oveja, hoja, yate, 
ahorro, etc.). Y, ciertamente, se han descrito algunos casos de disgrafia superficial. 
Finalmente, la disgrafia profunda es la más grave de todas, ya que los pacientes son incapaces 
de escribir seudopalabras y cometen numerosos errores con las palabras, especialmente con las 
de baja frecuencia, con las abstractas y con las funcionales (preposiciones, conjunciones, etc.). 
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Sin embargo, el síntoma principal de la disgrafia profunda lo constituyen los errores 
semánticos que los pacientes cometen al escribir al dictado; por ejemplo, pueden escribir 
«luna» cuando se les dicta «estrella» o «tío» cuando se les dicta «sobrino» (Cuetos y Labos, 
2001). La interpretación de este trastorno desde el modelo de doble ruta es que se ha dañado 
completamente la vía subléxica, razón por la que son incapaces de escribir seudopalabras, y 
parcialmente la vía léxica, lo que explica su dificultad con ciertas palabras, principalmente las 
de poco contenido semántico (abstractas, funcionales, etc.). 

En todos los trastornos en los que los pacientes cometen errores semánticos (en repetición en la 
disfasia profunda, en lectura en la dislexia profunda y en escritura al dictado en la disgrafia 
profunda) siempre aparece completamente dañada la vía subléxica, debido a que esta vía es la 
que impide los errores semánticos (Recuadro 12-5). 


Recuadro 12-5. Anomia, dislexia y disgrafia 

J.D. era un psicólogo de 46 años que sufrió un ictus que le dañó buena parte del lóbulo 
temporal izquierdo. No resultaron afectadas sus funciones perceptivas, ni de atención, ni de 
memoria, pero sí el lenguaje. J.D. presentaba ligeros problemas de comprensión, pero graves 
en producción hasta el punto de dificultarle la comunicación. 

En el test de vocabulario de Boston sólo consiguió nombrar 5 de los 60 dibujos y la mayoría 
de sus errores eran semánticos y ausencia de respuestas. Sus problemas no eran articulatorios, 
ya que repetía sin dificultad la mayoría de las palabras que se le presentaban. Tampoco eran 
principalmente semánticos, puesto que realizaba bastante bien la tarea de emparejamiento 
palabra-dibujo. 

Su lectura también estaba muy dañada: de una lista de 176 palabras solo, consiguió leer 
correctamente 14. No logró leer bien ningún verbo de 25 que se le presentaron y sólo 4 
palabras funcionales de 20. Tampoco conseguía leer ni una sola seudopalabra. La mayoría de 
sus errores eran semánticos; así, ante la palabra «vaca» leía «toro», con la palabra «niño» leía 
«bebé» o con «cebolla» leía «ajo». En muchos casos respondía «no sé» y en algunos, aunque 
no leía la palabra, hacía el dibujo correspondiente o la explicaba por señas (p. ej., no leyó la 
palabra «carreta» pero hizo un dibujo de una carreta). Estas respuestas indican que J.D. 
entendía las palabras aunque no fuese capaz de leerlas en voz alta. 

Su escritura también resultó afectada y sólo era capaz de escribir el 50 % aproximadamente de 
las palabras que se le dictaban. Era incapaz de escribir seudopalabras y tenía muchas dificul- 
tades con los verbos (sólo escribió bien 2 de 20 verbos que se le dictaron). Sus errores también 
eran principalmente semánticos; así, cuando se le dictó «piloto» escribió «avión», para 
«doctor» escribió «médico» y para «noche» escribió «luna». 

En definitiva, los trastornos de J.D. afectaban a tres modalidades del lenguaje: producción 
oral, lectura y escritura. Su diagnóstico fue de anomia pura, dislexia profunda y disgrafia 
profunda. Curiosamente se hallaba más afectada la producción oral que la escrita. En una 
tarea en la que se le presentaron 40 dibujos para que los nombrase (denominación oral) o 
escribiese sus nombre (denominación escrita), J.D. escribió correctamente el nombre de 20 de 
los dibujos, pero sólo nombró 3 de los dibujos. 
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Respecto a las disgrafias periféricas, también se distinguen varios tipos en función del 
mecanismo dañado, puesto que desde que se selecciona la representación ortográfica de la 
palabra hasta que se representa su forma concreta en el papel, la pizarra o la pantalla del 
ordenador aún quedan varias operaciones por realizar y todas ellas susceptibles de ser 
afectadas. Primero hay que seleccionar los grafemas que forman las palabras y retenerlos en la 
memoria a corto plazo mientras se están escribiendo. Después hay que transformar esos 
grafemas, que tienen un formato abstracto, en alógrafos concretos, es decir, indicar si se van a 
escribir en mayúscula o minúscula, es cursiva o en script, etc. Finalmente, hay que activar los 
patrones motores encargados de realizar los movimientos correspondientes para representar 
esos alógrafos, que serán diferentes según se escriba a mano o en el ordenador. Cada una de 
estas operaciones depende de una zona cerebral específica que puede sufrir una lesión y, por 
consiguiente, dificultar su realización, dando lugar a algún tipo de disgrafia periférica. 

Si bien en las disgrafias centrales desempeñan un importante papel las variables lingúísticas, 
como la lexicalidad, la frecuencia, la categoría gramatical, etc., en la ejecución de los 
pacientes, en las disgrafias superficiales las variables lingiísticas no tienen un papel relevante. 
Cuando un paciente presenta dificultades para escribir alógrafos, dichas dificultades se 
producen tanto en las palabras como en las seudopalabras y tanto en las palabras de contenido 
como en las funcionales. Las variables determinantes en estos casos son de tipo más 
superficial, como la forma de las letras, la frecuencia de los alógrafos o la longitud de las 
palabras. 

Un primer tipo de disgrafia periférica es el que se produce en la selección de los grafemas y su 
retención mientras se está escribiendo, puesto que al escribir una palabra necesitamos 
mantener activos en la memoria todos sus grafemas y en el mismo orden en el que aparecen en 
la palabra. Si el paciente no es capaz de retener los grafemas en este almacén grafémico, no 
podrá escribir la palabra o se equivocará en algunos de los grafemas. Los síntomas más 
comunes de este trastorno son los errores de omisiones, sustituciones e intercambios de 
grafemas, y la variable más determinante de su ejecución es la longitud de las palabras, ya que 
cuantos más grafemas tiene una palabra más posibilidades hay de que se olvide alguno. Este 
trastorno se produce tanto en la escritura a mano como con el ordenador, e incluso en el 
deletreo oral, puesto que para poder decir las letras de una palabra hay que retenerlas 
momentáneamente en la memoria de la misma forma que si fuésemos a escribirla. 

Un segundo tipo de disgrafia periférica se produce en la selección de los alógrafos, es decir, en 
la selección del tipo concreto de letra que se va a utilizar. Cuando se escribe a mano es 
importante decidirse por un tipo de letra u otro (p.ej., utilizamos diferente tipo de letra cuando 
rellenamos un formulario y cuando escribimos una carta), pero sobre todo es importante saber 
cuándo hay que utilizar mayúsculas (al comienzo de la escritura, después de un punto, con los 
nombres propios). Algunos pacientes tienen dificultades para seleccionar los alógrafos 
adecuados y a veces mezclan mayúsculas y minúsculas en una misma palabra. Otras veces 
pierden un tipo de alógrafos concreto, por ejemplo las minúsculas, y tienen que escribir todas 
las palabras con mayúsculas. 
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También están las disgrafias de tipo puramente motor, que se producen cuando una lesión daña 
los programas motores que controlan la formación de las letras. Estos trastornos sólo afectan a 
la escritura a mano; los pacientes pueden escribir al teclado o deletrear oralmente las palabras, 
debido a que estas actividades dependen de otros mecanismos neuronales (aunque también 
existe el caso contrario de pacientes que pueden escribir a mano pero han perdido la habilidad 
de escribir en el ordenador). A este tipo de trastorno se lo conoce como disgrafia apráxica, ya 
que en realidad se trata de una apraxia que afecta a su sistema de escritura. Algunos pacientes 
pueden seguir escribiendo aunque su letra está muy deformada y cuesta esfuerzo entenderla. 
Finalmente existe un tipo de disgrafia que se produce por alteraciones en los procesos 
perceptivos más que en los motores. La escritura a mano es una tarea de coordinación visual y 
motora muy compleja que exige constante información sobre los movimientos que se están 
realizando con la mano para poder ir guiando y corrigiendo la ejecución sobre la marcha. 
Cuando, por alguna razón, no se recibe esa información, 
resulta muy difícil hacer buena letra e incluso dibujar bien 
las letras (compruébese lo difícil que es escribir tapando 
la mano para no ver lo que se escribe o tratar de escribir 


Tabla 12-1. Resumen de los trastornos 
léxicos 

Comprensión oral 

Sordera verbal pura 

Sordera para la forma de las palabras 
Sordera para el significado de las palabras 


Agnosia fonológica 
Disfasia profunda 


Producción oral 
Anomia semántica 
Anomia pura 
Anomia fonológica 
Apraxia del habla 


Lectura 


frente a un espejo). Algunos pacientes tienen trastornos 
perceptivos que les impiden realizar esa necesaria 
coordinación visuomotora, por lo que su escritura aparece 
deformada. Los dos síntomas principales de este 
trastorno, denominado disgrafia aferente, son la tendencia 
a omitir o duplicar rasgos de las letras (escribir la «E» con 
cuatro líneas horizontales o la «m» con cuatro o cinco 


Dislexias periféricas 
Dislexia fonológica 


líneas verticales) y la dificultad para mantener la escritura 
en la línea horizontal (comenzar un renglón y terminarlo 
tres o Cuatro renglones hacia arriba o hacia abajo). En la 
tabla 12-1 se resumen los trastornos léxicos descritos en 
los puntos anteriores. 


Dislexia superficial 
Dislexia profunda 


Escritura 

Disgrafia fonológica 
Disgrafia superficial 
Disgrafia profunda 
Disgrafias periféricas 


TRASTORNOS SEMÁNTICOS 

Como se describió en el capítulo 7, el sistema semántico hace referencia a los significados 
tanto de las palabras como de los objetos y de las acciones; en definitiva, el sistema semántico 
abarca los conocimientos generales que tenemos del mundo. Por lo tanto, los pacientes con 
trastornos semánticos tienen dificultades para entender el significado de las palabras, con 
independencia de que se les presenten de manera oral o escrita, y también para reconocer 
dibujos y fotografías de objetos y animales, ya que el sistema semántico es común para todas 
las modalidades. Por la misma razón, su producción, tanto oral como escrita, también está 
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vacía de contenidos, dado que, aunque puedan conservar cierta fluidez verbal, les faltan los 
significados de las palabras, las representaciones subyacentes a las palabras. 
Las lesiones causantes de estos trastornos (Recuadro 12-6) suelen afectar a los lóbulos 
temporales, especialmente al izquierdo, que es una zona clave del procesamiento semántico, 
aunque también pueden afectar a otras áreas, como los lóbulos frontales o parietales. En 
función del tamaño de la lesión y de las áreas lesionadas los efectos varían. 


Recuadro 12-6. Trastornos semánticos 


M. tenía 24 años cuando sufrió una hemorragia cerebral que le dañó una amplia zona del 
hemisferio izquierdo, especialmente el lóbulo temporal. En un principio se le diagnosticó 
afasia mixta por sus problemas tanto de comprensión como de producción y tanto en el 
lenguaje oral como en el escrito. Después de varios años de rehabilitación, su lenguaje 
expresivo se consideró ya normal, aunque aún presentaba algunos problemas de comprensión 
y producción debido a trastornos semánticos. 

En todas las tareas que exigían el acceso a los significados, M. puntuaba por debajo de lo 
normal. Así, en la tarea de asociación semántica sólo respondió correctamente a 18 de los 30 
ítems que constituían la tarea, en la de emparejamiento palabra-dibujo falló en 3 y tuvo dudas 
en muchas otras, y en el test de denominación de dibujos del Boston sólo nombró bien 20 de 
los 60 dibujos. 

No presentaba, en cambio, dificultades con las tareas que podían responderse sin acceder al 
significado. Así, en la tarea de lectura en voz alta leyó sin cometer ni un solo fallo una lista de 
40 palabras. En escritura al dictado escribió correctamente las palabras, y en la tarea de 
decisión léxica acertó con los 40 estímulos (20 palabras y 20 seudopalabras) que se le 
presentaron. 

En las tareas de fluidez verbal su ejecución fue normal cuando se le pidió que dijera palabras 
que empezaran por una letra determinada. En 1 minuto nombró 16 palabras que empezaban 
por la «s» o 14 que empezaban por la «r». Sus problemas aparecieron cuando se le pidió que 
dijera, en el mismo tiempo, nombres de una categoría determinada. En la categoría 
herramientas sólo dijo martillo y clavo; en flores dijo uno, margarita; en muebles dijo mesa, 
cama, silla, mantel, toalla y habitación, y en verduras dijo coliflor, lombarda, guisantes, 
fabada y garbanzos. 

En la tarea en la que presentó enormes dificultades fue en la de categorización. Le costaba 
enormemente clasificar los ejemplares en categorías. Así, no distinguía entre animales 
salvajes y domésticos e incluyó la merluza, el centollo, la mosca, la araña y la rana entre los 
domésticos. Cuando se le preguntó si el camello era doméstico o salvaje respondió: «Es un 
animal salvaje porque no es como la vaca, pero tampoco mata a nadie, entonces será 
doméstico, y además come hierba así que será un doméstico-salvaje». Ante la pregunta ¿qué 
son los insectos? respondió: «No son como un elefante, caminan, no vuelan, no, algunos 
vuelan, algunos pican, otros no,... ¿qué comen?, ¿comen hierbas?, no, comen sangre, esto no 
lo sé muy bien». 

Es claro que los problemas de M. eran de tipo semántico, aunque su lenguaje estaba conser- 
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vado. Llama la atención su perfecta ejecución en la tarea de decisión léxica, lo que indica que 
reconocía bien las palabras, aunque no conociera su significado. 


En algunos pacientes los trastornos son leves y afectan sólo a los conceptos menos familiares o 
a los rasgos más específicos de algunos conceptos, mientras que en otros casos puede resultar 
gravemente dañado todo el sistema conceptual, como ocurre en algunos casos de infección por 
herpes simple. 

A veces, el trastorno parece afectar sólo a determinadas categorías semánticas dejando intactas 
las restantes. Así, una de las disociaciones más conocidas, señalada por Elizabeth Warrington 
a principios de los años ochenta, es la que se produce entre las categorías de seres vivos y 
objetos inanimados. Warrington y Shallice (1984) describieron 4 pacientes cuyas dificultades 
se limitaban a los seres vivos. No presentaban dificultad alguna para entender o definir objetos 
inanimados, pero tenían serias dificultades para nombrar o describir seres vivos. En concreto, 
uno de los casos más graves, el paciente J.B.R., que había sufrido una encefalitis por herpes 
simple, nombraba el 90 % de los dibujos de objetos inanimados y sólo el 6 % de los seres 
vivos. Definía perfectamente objetos como «brújula», de la que decía «objeto que sirve para 
orientarse...», O «Carpeta», que definía como «pequeño contenedor usado por los estudiantes 
para transportar papeles» y era incapaz de dar la mínima información sobre qué es un loro o un 
avestruz. Por el contrario, una paciente descrita por Warrington y McCarthy (1983) que había 
sufrido un infarto en la zona parietal izquierda, presentaba el patrón opuesto: mayor dificultad 
con los objetos inanimados que con los seres vivos. A lo largo de los años se han publicado 
numerosos casos de trastornos afectando a una de esas categorías, aunque abundan más los 
casos de alteraciones para los seres vivos. En general se ha comprobado que los pacientes con 
trastorno para nombrar los seres vivos suelen tener lesionados los lóbulos temporales (en 
muchos de los casos debido a infección por herpes simple), mientras que en los pacientes con 
trastorno para nombrar los objetos inanimados la lesión suele localizarse en la zona 
frontoparietal. 

Algunos autores han apuntado la posibilidad de que la mayor resistencia al daño de los objetos 
inanimados se deba a que son más familiares, pues no cabe duda de que estamos más 
familiarizados con objetos como el tenedor, el bolígrafo o el martillo que con los animales 
(con excepción de perros y gatos). Aun así, en algunos estudios en los que se emparejaban los 
ítems de ambas categorías en familiaridad, algunos pacientes mostraban más dificultades con 
una de las categorías. Por ejemplo, Hillis y Caramazza (1991) utilizaron los mismos estímulos 
para evaluar a dos pacientes, J.J. y P.S., y obtuvieron resultados opuestos: J.J. tenía más 
dificultades con los objetos inanimados y P.S. con los seres vivos. 

Estas dos grandes categorías semánticas pueden, a su vez, subdividirse en otras categorías más 
pequeñas. Así, dentro de la categoría de seres vivos se han encontrado disociaciones entre 
animales, por un lado, y vegetales y frutas, por el otro. Así, una paciente descrita por 
Caramazza y Shelton (1998) reconocía y nombraba perfectamente los ejemplares de las 
categorías vegetales y frutas, así como los objetos inanimados, y, sin embargo, tenía serias 
dificultades con los animales. Por el contrario, un paciente descrito por Hillis y Caramazza 
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(1991) nombraba sin problema los animales pero tenía dificultades con las verduras y frutas y 
también con los objetos inanimados. Por lo general, en los pacientes con trastornos para la 
subcategoría animales la lesión se localiza en ambos lóbulos temporales y en la zona anterior, 
mientras que en los pacientes con trastornos para la subcategoría vegetales y frutas la lesión se 
halla en un área más posterior del lóbulo temporal izquierdo y alcanza la circunvolución 
fusiforme. 

Esta organización de los conceptos en categorías facilita la percepción del mundo y, por lo 
tanto, es relevante para la supervivencia de la especie humana (Caramazza y Shelton, 1998). 


TRASTORNOS EN LA ORACIÓN 

Hasta ahora se han descrito los trastornos que pueden producirse a nivel léxico, es decir, las 
dificultades para comprender, producir, leer o escribir palabras. Algunos pacientes no tienen 
dificultades con las palabras en sí mismas, pero presentan serios problemas para comprender o 
formar oraciones. 

Los trastornos en la oración suelen asociarse a lesiones en el área de Broca o en zonas 
próximas a ella. El término genérico que se utiliza para referirse a este trastorno es el de 
agramatismo, aunque hay algunas variantes. Así, algunos pacientes tienen dificultades tanto 
para entender oraciones complejas como para producirlas. Otros, en cambio, sólo presentan 
dificultades para producirlas pero no para comprenderlas, y otros, a la inversa, las tienen para 
comprenderlas pero no para producirlas. Esto significa que puede haber disociaciones entre 
comprensión y producción de oraciones. 

Los trastornos de comprensión se producen principalmente con las oraciones que no siguen el 
orden canónico, es decir, con las oraciones en las que el agente de la oración va después del 
objeto de la acción. Normalmente, en las oraciones con estructura nombre-verbo-nombre, el 
primer nombre hace de sujeto de la oración, y el segundo de objeto (p. ej., el perro persigue al 
caballo; la mujer abraza al hombre, etc.). Con determinadas estructuras sintácticas no se 
cumple esta norma; es el caso de las oraciones pasivas (p. ej., el perro es perseguido por el 
caballo; la mujer es abrazada por el hombre, etc.) o de las oraciones de objeto focalizado (p. 
ej., al perro lo persigue el caballo). En estos casos, los pacientes agramáticos tienden a aplicar 
la estrategia canónica con independencia de la estructura de la oración y asignan el papel de 
sujeto al primer sintagma y el de objeto al segundo, por lo que invierten los papeles de la 
oración. Un tipo de oraciones con las que estos pacientes tienen especiales dificultades son las 
subordinadas de relativo (p. ej., el perro que persigue al caballo es negro) y, sobre todo, con las 
subordinadas de relativo de objeto (p. ej., el perro al que persigue el caballo es negro), ya que 
el primer sintagma hace de sujeto de la oración principal y de objeto de la oración subordinada. 
En cuanto a los trastornos de producción, el habla de los pacientes con agramatismo se 
caracteriza por el escaso uso de palabras funcionales (preposiciones, pronombres, etc., e 
incluso verbos auxiliares), aunque conservan las de contenido, por lo que su lenguaje recuerda 
el lenguaje telegráfico en el que escasean las preposiciones y los artículos. Las oraciones son 
muy cortas y de estructuras sintácticas muy simples. También tienen dificultades de tipo 
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morfológico, en especial para conjugar correctamente los verbos, así como con los sufijos, 
sobre todo los verbales de tiempo y persona. 

No obstante, el hecho de que el agramatismo en general se caracterice por los síntomas 
mencionados no significa que todos los pacientes agramáticos presenten todos los síntomas, ya 
que se han descrito pacientes que presentan algunos síntomas pero no otros. Berndt (1987) 
describió pacientes que construían oraciones con estructuras gramaticalmente correctas pero 
omitían sufijos y palabras funcionales, mientras que otros conservaban los sufijos pero las 
oraciones que construían eran gramaticalmente anómalas, lo que sugiere una disociación entre 
estructuras sintácticas y marcadores gramaticales. 


TRASTORNOS EN EL DISCURSO 
Los trastornos específicos en la comprensión y producción del discurso son característicos de 
los pacientes con lesiones en el hemisferio cerebral derecho. A diferencia de los que tienen 
dañado el hemisferio izquierdo, los pacientes con lesiones en el hemisferio derecho rara vez 
presentan afasia. Sus capacidades fonológicas, léxicas o semánticas parecen inalteradas, sin 
presentar, por ejemplo, dificultades de nombrado de objetos o acciones, ni de fluidez léxica. 
Tampoco muestran agramatismo ni dificultades en la comprensión de oraciones. Sin embargo, 
como se ha mencionado en el capítulo 9, existe otro nivel cognitivo en la comprensión y 
producción del lenguaje, el discurso, y es precisamente en el discurso donde los pacientes con 
lesiones en el hemisferio derecho presentan déficits importantes. Estos déficits son más sutiles 
y difíciles de observar, mediante las pruebas diagnósticas convencionales, que los déficits de 
los afásicos o disléxicos, pero son también muy incapacitantes. Por otra parte, se manifiestan 
claramente en los contextos más cotidianos de uso del lenguaje, como las conversaciones o la 
comprensión y producción de relatos complejos, en las que los procesos discursivos y 
pragmáticos son imprescindibles (véase revisión de Johns, Tooley y Traxley, 2008). Como 
expresó uno de estos pacientes para referirse a su experiencia en estos contextos cotidianos: 
«Se me escapa el complejo mosaico de significado que es el lenguaje» (Beeman, 1993, p. 113). 
A continuación veremos con detalle en qué consisten estos trastornos. 
Dificultades en captar el tema principal del discurso o de la conversación. Varios estudios 
han mostrado que los pacientes con lesiones en el hemisferio derecho tienden a prestar 
atención a los detalles más que al significado global del discurso. No comprenden la relación 
entre los diferentes sucesos del discurso y no pueden, por lo tanto, derivar su sentido. Por 
ejemplo, en un estudio realizado por Hough (1990), en el que se compararon pacientes con 
lesión anterior o posterior del hemisferio derecho y pacientes con lesión de hemisferio 
izquierdo y controles, se constató que sólo los pacientes con lesiones en el hemisferio derecho 
tenían dificultad para hallar el tema central de las narraciones escuchadas, especialmente 
cuando éstas incluían la información con valor organizativo del tema al final en lugar del 
principio. Veamos un ejemplo de ambos tipos de narraciones. 

Tema central presentado al principio 
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Pedro estaba en la acera frente a su casa con su hermanito pequeño, Gabi. Sus 
padres fueron de compras y Pedro tenía que vigilar a Gabi hasta que volviesen. 
Gabi siempre parecía meterse en algún lío. Un amigo de Pedro se acercó en su 
bici y se detuvo a hablar con Pedro. Gabi se dirigió hacia la calzada y Pedro lo 
detuvo justo a tiempo. Luego Gabi empezó a correr por las escaleras del portal. 
Antes de que Pedro pudiese alcanzarlo, Gabi se cayó y se hizo un rasguño en una 
rodilla. Gabi estaba chillando cuando llegaron sus padres de la compra. 
Tema central presentado al final 
Gabi siempre parecía meterse en algún lío. Un amigo de Pedro se acercó en su 
bici y se detuvo a hablar con Pedro. Gabi se dirigió hacia la calzada y Pedro lo 
detuvo justo a tiempo. Luego Gabi empezó a correr por las escaleras del portal. 
Antes de que Pedro pudiese alcanzarlo, Gabi se cayó y se hizo un rasguño en una 
rodilla. Gabi estaba chillando cuando llegaron los padres de Pedro de la 
compra. Pedro había estado vigilando a su hermanito pequeño en la acera frente 
a su casa, mientras sus padres fueron de compras. 
En efecto, cuando se les pedía que recordasen las ideas principales y el tema central de la 
narración, los pacientes con lesiones en el hemisferio derecho rindieron mucho peor que los 
participantes sanos e incluso que los pacientes con lesiones en el hemisferio izquierdo, sobre 
todo en la condición de tema presentado al final. Además, los pacientes con lesiones en el 
hemisferio derecho cometían más errores al introducir repeticiones, añadir comentarios 
innecesarios (p. ej., «el llanto del niño asustó a todos») e incluso confabulaciones (p. ej., «los 
padres estaban durmiendo»). 
Dificultades en la realización de inferencias. Con frecuencia, para poder integrar el discurso 
en grandes unidades coherentes es necesario que el receptor del discurso realice ciertas 
inferencias, insertando mentalmente información no explícita. Los pacientes con lesiones en el 
hemisferio derecho no parecen disponer de esta capacidad inferencial que los individuos de 
control e, incluso, los pacientes con lesiones en el hemisferio izquierdo, aplican habitualmente 
durante la comprensión del discurso. Por ejemplo, cuando los individuos de control escuchan: 
«Laura se acercó al actor de cine con su pluma y su cuaderno en la mano. Ella estaba 
escribiendo un artículo sobre la opinión de los famosos acerca de la energía nuclear», 
generalmente infieren que Laura va a entrevistar al actor para el artículo, mientras que los 
pacientes con lesiones en el hemisferio derecho podrían responder que Laura va a pedir un 
autógrafo. Es decir, los pacientes con lesiones en el hemisferio derecho no serían capaces de 
realizar una inferencia contextual para establecer el vínculo temático (necesario para la 
coherencia) entre la primera y la segunda oración (Brownell, 1988; Beeman, 1993). En lugar 
de ello, realizarían una inferencia rutinaria basada en los conocimientos esquemáticos del 
mundo, algo que su hemisferio izquierdo intacto puede realizar perfectamente. 
Dificultades en interpretar la información paradiscursiva relativa a los estados 
emocionales del interlocutor o del personaje narrativo. Por ejemplo, en un estudio se 
observó que los pacientes con lesiones en el hemisferio derecho, al contrario que los 
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individuos de control, tenían dificultad para interpretar las intenciones sarcásticas o chistosas 
de los personajes de una narración oral, que podrían derivarse de su estado de ánimo y de la 
situación. Sin embargo, estos pacientes eran muy sensibles a la presencia de pronombres 
anafóricos en la narración, a diferencia de los afásicos. 
Dificultades en los aspectos prosódicos del habla. Una característica aparente del habla de 
los pacientes es su monotonía o aprosodia. Por otra parte, también se ha demostrado que tienen 
dificultades para interpretar la entonación del habla de sus interlocutores. Por ejemplo, los 
pacientes con lesiones en el hemisferio derecho tienen más dificultades que los individuos 
normales y que los pacientes con lesiones en el hemisferio izquierdo para utilizar los índices 
prosódicos para inferir si una oración ha terminado o no (Grosjean y Hirt, 1996). La 
entonación prosódica contribuye a estructurar o segmentar el discurso y, además, proporciona 
indicios expresivos sobre los estados de ánimo del interlocutor, el foco o tema del discurso, los 
elementos catafóricos, etc. Por ello, las dificultades de los pacientes pueden ser determinantes 
en los problemas de integración del discurso que se han mencionado. 
Dificultades para comprender el lenguaje indirecto. Los pacientes tienen tendencia a 
entender las metáforas y los modismos o frases hechas de un modo literal. Por ejemplo, cuando 
escuchan expresiones como «tiene un corazón de oro», los pacientes con lesiones en el 
hemisferio derecho pueden elegir un dibujo que muestra literalmente a alguien con una joya de 
oro en forma de corazón. Respecto a las peticiones indirectas, como «¿puedes abrir la 
puerta?», aunque son capaces de interpretarlas en su sentido no literal dominante («por favor, 
abre la puerta»), muestran dificultades para comprenderlas literalmente e integrarlas en el 
contexto del discurso. Por ejemplo, la expresión «¿puedes abrir la puerta?» dirigida a un niño 
que se ha quedado encerrado en una habitación. 
Dificultades para comprender el humor. La comprensión y el consiguiente regocijo que 
producen los chistes requieren procesos semánticos, cognitivos y emocionales muy 
sofisticados, que incluyen la búsqueda de coherencia, la aplicación de conocimientos del 
mundo y de la teoría de la mente, la detección del conflicto con las expectativas (sorpresa), la 
elaboración de inferencias o la reinterpretación novedosa del contexto. Los pacientes con 
lesiones en el hemisferio derecho no parecen comprender el humor, como lo demuestra su 
dificultad para elegir entre varias alternativas de un final chistoso. Así, Chean y Pell (2006) 
presentaron a los pacientes con lesiones en el hemisferio derecho y a los controles pequeños 
textos en los que debían elegir un final chistoso o bien un final coherente entre varias 
alternativas. Por ejemplo: 

Marta entró en la pastelería. Después de explorar todos los dulces se decidió por una 

tarta de chocolate y le dijo al dependiente: «Yo quiero ésta, completa...». El 

dependiente preguntó: «¿Quieres que la corte en 4 trozos o en 8 trozos?» 

Marta contesta: «Bueno, como hay 5 personas invitadas hoy, creo que 8 trozos estará 

bien» (coherente con la historia). [a] 

Marta contesta: «Hacéis los pasteles más deliciosos de la ciudad» (temáticamente 

relacionado pero no coherente). [b] 
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Luego el pastelero le arroja crema batida a la cara de Marta (final de payasada). [c] 
Marta contesta: «En 4 trozos por favor; estoy a dieta» (final chistoso). [d] 

Los pacientes con lesiones en el hemisferio derecho eligieron con menos frecuencia [d] 
cuando se les pedía un final chistoso que los controles, mientras que no hubo diferencias en la 
elección cuando se les pedía un final coherente. 

Los trastornos del lenguaje que hemos reseñado son específicos de los pacientes con lesiones 
en el hemisferio derecho y están ausentes en los afásicos. La doble disociación entre ambos 
síndromes es posible, ya que en varios de los estudios citados se utilizaron como individuos de 
control pacientes afásicos y/o pacientes con lesiones en el hemisferio izquierdo, y éstos no 
mostraron los déficits asociados al discurso característico de los pacientes con lesiones en el 
hemisferio derecho. Es importante integrar los estudios de estos pacientes con el cuerpo 
general de conocimientos sobre el procesamiento del discurso, pues ello permitiría, como ya 
ha ocurrido en la afasia, beneficios mutuos para la psicolingúística y para la propia 
rehabilitación de los pacientes. Por el momento ha habido algunos intentos de relacionar las 
dificultades de los pacientes con algunas de las teorías psico-lingúísticas del discurso. Por 
ejemplo, algunos opinan que los pacientes con lesiones en el hemisferio derecho presentan 
problemas de valoración del contexto, tanto intralingúístico como extralingúístico, problemas 
en la elaboración de la macroestructura del discurso en la línea de la teoría de Kintch y Van 
Dijk, problemas de construcción y cambio de estructuras acorde con la teoría de Gersnbacher, 
dificultades para tener en cuenta las convenciones pragmáticas conversacionales o para juzgar 
la plausibilidad de las situaciones y déficits en la «teoría de la mente» necesaria para establecer 
la coherencia en la comprensión del narraciones. 


ALTERACIONES DEL LENGUAJE EN LAS DEMENCIAS 
NEURODEGENERATIVAS 

El incremento de la edad media de vida es uno de los grandes logros de la humanidad, pero trae 
aparejado el incremento de las demencias neurodegenerativas. Cuantos más años viva una 
persona, más posibilidades tiene de sufrir este tipo de enfermedades. Hay muchos tipos de 
demencias neurodegenerativas, pero las tres más comunes son las enfermedades de Alzheimer 
y Parkinson y las frontotemporales. En las tres se producen alteraciones del lenguaje, junto con 
otras alteraciones cognitivas, que se agravan a medida que la enfermedad avanza. 
Enfermedad de Alzheimer. Aunque los primeros síntomas que presentan los enfermos de 
Alzheimer son los trastornos de memoria, las dificultades con el lenguaje son también bastante 
tempranas, si bien pueden ser más sutiles y pasar inadvertidas. De hecho, cuando se utilizan 
pruebas finas se descubren alteraciones en todos los componentes del lenguaje, tanto oral 
como escrito y tanto en comprensión como en producción, desde los inicios de la enfermedad 
(Cuetos, Martínez, Martínez, Izura y Ellis, 2003). 

Los enfermos de Alzheimer comienzan pronto a presentar problemas de comprensión, que se 
manifiestan en dificultades para seguir el discurso, especialmente si éste tiene cierta 
complejidad. Esto se observa en la pérdida de interés por el cine en personas que eran muy 


booksmedicos.org 


Psicología del Lenguaje — TEMA 12 


cinéfilas o incluso por participar en conversaciones de cierta profundidad. También empiezan 
a tener dificultades para comprender palabras, sobre todo las de baja frecuencia de uso, así 
como las palabras abstractas. 

En producción, los síntomas son aun más detectables, debido a que los enfermos de Alzheimer 
comienzan a presentar pronto problemas anómicos. Al escuchar su habla se detectan 
abundantes circunloquios debido a que no encuentran la palabra que quieren utilizar y también 
términos genéricos del tipo «cosa» o «animal». Una tarea muy sensible para detectar los 
trastornos anómicos es la de denominación de dibujos, en la que se comprueba la abundancia 
de circunloquios y de errores semánticos. A medida que se agrava la enfermedad comienzan a 
aumentar las respuestas «no sé» (Cuetos, Glez-Nosti y Martínez, 2005). 

Progresivamente van perdiendo el interés por el lenguaje escrito, y así personas que solían leer 
el periódico o revistas, van abandonando la lectura, a veces con disculpas simples, como que 
no tienen las gafas a mano, y otras veces con argumentos más sofisticados, como que ya no les 
interesan las noticias. También abandonan la escritura, porque cada vez les cuesta más 
escribir. Primero empiezan a aparecer faltas de ortografía, después comienzan a mezclar letras 
en mayúscula y minúscula porque cada vez les resulta más complicado ejecutar los programas 
motores de la escritura a mano. 

Enfermedad de Parkinson. La enfermedad de Parkinson es conocida principalmente por los 
trastornos de tipo motor. Sin embargo, también conlleva otras alteraciones psicológicas y 25 
cognitivas. Las alteraciones cognitivas más evidentes son las que afectan a las funciones 
ejecutivas (capacidad de planificación, toma de decisiones, atención, memoria operativa, etc.), 
como consecuencia de la afectación de los circuitos frontales. Aunque menos apreciables, los 
pacientes con enfermedad de Parkinson también presentan alteraciones del lenguaje, que 
afectan tanto a los procesos superiores, como la comprensión de oraciones, la comprensión de 
metáforas O la capacidad para realizar inferencias, como a los procesos de los ámbitos léxico y 
semántico, que se reflejan en las tareas de fluidez verbal o denominación de dibujos, 
especialmente de acciones (Rodríguez-Ferreiro, Menéndez, Ribacoba y Cuetos, 2009). 
Algunos autores sostienen que estos trastornos del lenguaje se deben realmente a los 
problemas en las funciones ejecutivas. Ciertamente, algunos, como la dificultad para realizar 
inferencias, la comprensión de metáforas e incluso la fluidez verbal fonológica, podrían ser 
una simple consecuencia de las alteraciones ejecutivas. Pero los trastornos lexicosemánticos 
difícilmente se puedan achacar a trastornos ejecutivos. Así, los enfermos de Parkinson tienen 
especiales dificultades para procesar los verbos tanto en tareas de denominación como en 
tareas de fluidez, y en mayor medida cuando se trata de verbos referidos a acciones (Herrera, 
Rodríguez-Ferreiro y Cuetos, 2012). Esta alteración probablemente sea debida a la lesión en 
las redes neuronales que se extienden por zonas de los lóbulos frontales y que son responsables 
del procesamiento de las palabras referidas a acciones. 

Demencia frontotemporal. Aunque menos conocida que las enfermedades de Alzheimer y de 
Parkinson, la demencia frontotemporal constituye la segunda causa de demencia más común 
antes de los 65 años. Se la denomina frontotemporal porque la lesión afecta principalmente a 
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esas dos zonas cerebrales; dependiendo de dónde se produzca antes la degeneración cortical se 
distinguen dos variantes: variante conductual, cuando la atrofia comienza en la zona frontal, y 
afasia primaria progresiva, cuando afecta a la zona perisilviana entre los lóbulos frontal y 
temporal. 

Los pacientes con afasia primaria progresiva presentan trastornos de tipo lingúístico (lenguaje 
espontáneo empobrecido con abundantes anomias y circunloquios, frases cortas y lenguaje 
vacío de contenido) desde los primeros momentos de la enfermedad, mientras conservan las 
restantes Capacidades cognitivas (memoria, atención, etc.). Se distinguen dos tipos de afasia 
primaria progresiva, según la zona cerebral que comienza antes a atrofiarse. Cuando la atrofia 
se inicia en la región perisilviana anterior (lóbulo frontal) el habla es poco fluida, con 
abundantes errores fonológicos, trastornos articulatorios y agramatismo, pero la comprensión 
está conservada, es decir, se trata de un cuadro muy similar a la afasia de Broca, al que se 
denomina afasia primaria progresiva no fluente. Cuando la atrofia comienza en la parte 
anterior del lóbulo temporal se habla de afasia primaria progresiva fluente o demencia 
semántica, puesto que el déficit es puramente semántico. Los pacientes con demencia 
semántica tienen dificultades para comprender todo tipo de información conceptual 
(significados, objetos, hechos, sonidos, caras, etc.), en especial los conceptos menos 
familiares, tanto si sus nombres se presentan oralmente o por escrito o si se presentan 
fotografías o dibujos. También tienen dificultades para nombrarlos o dibujarlos, ya que la 
información conceptual es ajena 
Recuadro 12-7. Demencia semántica a la modalidad perceptiva. En 
cambio, no presentan ningún 


J.L. llevaba una vida activa como director de una empresa hasta que a los 58 años de edad 
comenzó a tener problemas para recordar los nombres de las personas y de los lugares. Dos años trastorno fonoló gic oni sintáctico 
después su vocabulario había disminuido de manera brusca causándole problemas anómicos 2 
en su conversación. Su familia también había notado dificultades para comprender palabras — nj de memoria O ej ecutivos. 
comunes como, por ejemplo, alimentos. Su memoria autobiográfica, sin embargo, se conservaba 
perfectamente. La resonancia magnética mostró una extensa atrofia en los lóbulos temporales. De hecho, los inicios de la 
J,L. fue diagnosticado de demencia semántica. 


Se le realizó un seguimiento durante 2 años, con evaluaciones cada 6 meses en tareas neu- enfermedad tardan mas en 
ropsicológicas muy variadas de memoria, lenguaje, orientación, percepción, etc. En las tareas r len ¡ 
de memoria, como el test de la Figura Compleja de Rey o la prueba de digitos, los resultados se detectarse A bir pd 
mantuvieron estables a lo largo de los 2 años, al igual que en las de percepción. Sin embargo,en fluido y gramaticalmente 
todas las tareas relacionadas con los significados tuvo un empeoramiento importante. En fluidez 


semántica (nombres de animales) nombró 10 la primera vez, 6 la segunda, 3 la tercera y 3 la correcto, aunque una valoración 
cuarta. En la tarea de emparejamiento palabra-dibujo señaló bien 31 (de 48) la primera vez, 27 


la segunda, 25 la tercera y 16 la cuarta. En denominación de dibujos del test de Boston nombró detenida revela un lenguaje vacío 
10 (de 60) la primera vez, 9 la segunda (la tercera no se le pasó) y O la última. ] 
caelemiecos confia de contenidos y con abundantes 
Además, los errores que cometía en la denominación de dibujos son muy ilustrativos de cómo 
fue perdiendo J.L. los conceptos. Estímulos que en la primera evaluación nombraba bien, más circunloquios y anomias como 
tarde los confundía con otros relacionados semánticamente hasta terminar por decir sólo la 


categoría general a la que pertenecian o, incluso, una categoría con la que no tenian ninguna consecuencia de la pérdida con- 
relación. Los siguientes son ejemplos de los cambios de J,L. en la denominación de algunos estí- 


mulos en sólo 2 años. ceptual, (Recuadro 12-7). 

Dibujo Inicio 6 meses 12 meses 18 meses 

Pollo Y Y Ave Animal 

Pato Y Ave Ave Perro 

Cisne Y Ave Ave Animal 

Aguila Pato Ave Ave Caballo 

Pavo real Pato Pájaro Goto Vehículo 

Elefante Y Caballo Caballo Animal 

Ciervo Y Caballo Vaca Vehículo 

Calabaza Vegetal Huevo Animal Vehículo 
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EVALUACIÓN DEL LENGUAJE 

A lo largo de los capítulos anteriores se han descrito algunas de las tareas empleadas para 
comprobar el funcionamiento de los diferentes componentes del sistema de procesamiento 
lingúístico. Así, se planteó la tarea de decisión léxica como la forma ideal de estudiar el 
proceso de reconocimiento de palabras, ya que para poder decidir si un grupo de letras o 
fonemas constituyen una palabra real es necesario comprobar si en el léxico mental existe 
alguna palabra formada exactamente por esas letras y en ese mismo orden; la tarea de fluidez 
categorial para el estudio del sistema semántico, pues para poder enumerar los ejemplares de 
una categoría determinada es necesario recuperar la información del sistema semántico, o la 
tarea de verificación de frases para estudiar el procesamiento sintáctico, dado que no se puede 
decidir si una frase es gramaticalmente correcta si no se procesa sintácticamente. 

En este apartado se presentarán de una manera sistematizada las principales tareas utilizadas 
en la evaluación de todos y cada uno de los componentes del sistema de procesamiento 
lingúístico, desde los más periféricos hasta los más centrales, tanto en comprensión como en 
producción y tanto en el lenguaje oral como en el escrito. Estas tareas, que se irán 
especificando, se utilizan para evaluar el lenguaje tanto de las personas sanas como de aquellas 
que sufren un trastorno del lenguaje, sea por lesión cerebral (afasias) o por enfermedades 
genéticas (trastorno específico de lenguaje, dislexia, etc.) y en adultos, ancianos o niños. Lo 
que cambia, en función de la población, es la complejidad de los estímulos, por ejemplo, la 
frecuencia de las palabras en la tarea de decisión léxica o la complejidad de las estructuras 
sintácticas en la tarea de verificación de frases. También puede cambiar la medida de las 
respuestas; así, en los pacientes puede ser suficiente con medir la precisión (aciertos y errores), 
mientras que en las personas sanas, además de la precisión, se tiene en cuenta la velocidad de 
respuesta. 

También se describirán en este apartado las variables o características de los estímulos que 
influyen en cada una de las tareas (frecuencia, familiaridad, longitud, etc.), puesto que 
determinan los resultados de los participantes, en el caso de personas sanas induciendo 
pequeñas diferencias en las latencias de sus respuestas, y en los pacientes determinando que 
sus respuestas sean correctas o erróneas. Así, es posible que un paciente disléxico pueda leer 
una lista de palabras si éstas son de alta frecuencia, pero no pueda hacerlo sin son de baja 
frecuencia, o que un paciente agramático entienda oraciones si conservan la estructura 
canónica, pero no si carecen de ella, como ocurre con las oraciones pasivas. 

Con respecto a la percepción del habla, como se ha señalado, una de las primeras y más 
importantes tareas/funciones es la identificación de fonemas. La identificación de los fonemas 
es fundamental para poder reconocer las palabras. Las pruebas más utilizadas para evaluar este 
proceso son la tarea de pares mínimos, la discriminación de fonemas, la de señalar una 
determinada letra o la de repetición de fonemas. En la tarea de pares mínimos se pronuncian 
pares de palabras o seudopalabras para que el participante responda si son iguales o diferentes. 
Generalmente la mitad de los estímulos son iguales (sol-sol), y la otra mitad, diferentes 
(sol-gol). En el caso de los estímulos diferentes, unas veces cambia el fonema inicial, otras 
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veces uno del medio y otras veces el final. En la tarea de discriminación de fonemas, el 
evaluador pronuncia un fonema (/f/) y después se van nombrando palabras (fama, mesa, 
calefacción, etc.) o seudopalabras (rope, gufal, etc.) para que el participante indique si 
contienen o no ese fonema. En la tarea de señalar la letra se presentan al paciente varias letras 
escritas y se le pronuncian fonemas para que señale la letra que le corresponde. En la 
repetición de fonemas, el participante simplemente tiene que repetir los fonemas que el 
evaluador le va diciendo. 

Para el reconocimiento de las palabras habladas la tarea más comúnmente empleada es la de 
decisión léxica auditiva. En esta tarea, el paciente escucha una lista de palabras y 
seudopalabras mezcladas y, ante cada una de ellas, tiene que responder, generalmente 
mediante dos botones o teclas del ordenador, si corresponde o no a una palabra real. En 
función de las características de las palabras (frecuencia, imaginabilidad, longitud, vecindad 
fonológica, edad de adquisición, punto de unicidad, etc.) los pacientes con trastornos en la 
percepción del habla (sordera para las palabras) tendrán un mayor o menor número de aciertos 
y las personas sanas tendrán diferentes latencias de respuesta. Como se ha descrito en el 
capítulo 6, se tarda unos milisegundos menos en reconocer las palabras de alta frecuencia que 
las de baja frecuencia o las palabras con el punto de unicidad al comienzo que las que lo tienen 
al final. Por eso es sumamente importante en cualquier tipo de estudio tener en cuenta las 
características psicolingúísticas de las palabras cuando se prepara una tarea de decisión léxica, 
pero muy especialmente cuando se trata de pacientes con trastornos del lenguaje, pues esas 
características son las que pueden determinar que el paciente sea capaz o no de realizar la 
tarea. 

Para evaluar el mecanismo de conversión acústico en fonológico la tarea más eficaz es la de 
repetición y, en especial, la de repetición de seudopalabras, dado que las palabras se pueden 
repetir a través del léxico, reconociendo la palabra, pero para repetir seudopalabras el 
mecanismo de conversión acústico-fonológico es el único procedimiento posible. Cuando este 
mecanismo resulta completamente dañado como consecuencia de una lesión, como ocurre en 
la agnosia fonológica, los pacientes pueden repetir las palabras familiares (de las que tienen 
representación en el léxico mental), pero son incapaces de repetir las palabras de baja 
familiaridad y las seudopalabras. Pueden repetir, por ejemplo, la palabra «salto» y son 
incapaces de repetir «tosal» a pesar de estar formadas por los mismos fonemas y las mismas 
sílabas. 

Para evaluar el sistema conceptual o semántico existe una gran variedad de tareas, aunque la 
más utilizada posiblemente sea la de categorización semántica. Esta consiste en presentar 
diferentes estímulos para que los participantes indiquen la categoría a la que pertenecen. Los 
estímulos pueden presentarse de forma escrita, oral o por medio de fotografías o dibujos, y las 
categorías pueden ser dos (p. ej., animales salvajes frente a domésticos) o varias (mamíferos, 
peces, aves, etc.). En el caso de pacientes, habitualmente se colocan varias fotografías sobre 
una mesa para que el paciente las vaya colocando en las cajas correspondientes a las 
categorías. Por ejemplo, se colocan varias fotografías de animales y cuatro cajas, una para los 
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mamíferos, otra para las aves, otra para los peces y otra para los reptiles y el paciente tiene que 
colocar cada fotografía en la caja correspondiente. En el caso de personas sanas lo más usual es 
utilizar sólo dos categorías y presentar las fotografías o nombres de los ejemplares en la 
pantalla del ordenador para que los participantes pulsen lo más rápido posible uno de los dos 
botones, dependiendo de la categoría a la que pertenezca el ejemplar. Esta tarea es muy 
aconsejable cuando se sospecha que un paciente puede presentar disociación entre categorías 
semánticas. 

Otra prueba también destinada al sistema conceptual es la de señalar el elemento diferente. Se 
presentan varios estímulos, mediante fotografías, dibujos o palabras, todos los cuales, excepto 
uno, pertenecen a una determinada categoría, y el participante tiene que señalar cuál es el 
diferente, el que no pertenece a esa categoría (p. ej., martillo, alicates, cuchara, tenazas y 
destornillador). 

En la tarea de emparejamiento palabra-dibujo se presentan varios dibujos y el evaluador 
nombra uno de ellos para que el participante lo señale. En esta prueba es muy importante 
seleccionar bien los estímulos distractores, pues no es lo mismo señalar un leopardo cuando 
los distractores son una mesa, un caracol y un árbol que cuando son un león, un tigre y una 
pantera. Cuanto más relacionados están los distractores con el estímulo que se ha de señalar, 
más difícil resulta la tarea. 

En el caso de pacientes con trastornos semánticos como la demencia semántica, la tarea más 
utilizada es la de asociación semántica basada en el test de pirámides y palmeras de Howard y 
Patterson (1992). Consiste en presentar tres dibujos o tres palabras, uno en la parte de arriba y 
dos en la de abajo, y el paciente tiene que indicar cuál de los dibujos de abajo está relacionado 
con el de arriba. Por ejemplo, en el test hay una pirámide en la parte de arriba y dos árboles, 
una palmera y un abeto, en la parte de abajo. Para poder responder que es la palmera la que se 
relaciona con la pirámide el paciente tiene que saber que las palmeras abundan en los lugares 
cálidos como Egipto donde se encuentran las pirámides, mientras que los abetos son más 
propios de los lugares fríos. 

Finalmente, otra tarea muy utilizada, por su sencillez, ya que no requiere material 
complementario, y por su brevedad, puesto que sólo se tarda un minuto, es la de fluidez 
semántica. Durante un minuto el participante tiene que decir el mayor número posible de 
ejemplares de la categoría que se le indique (animales, frutas, herramientas, etc.). 

Para la evaluación de la producción oral la tarea más utilizada es la de denominación de 
dibujos. Se le van presentando dibujos de objetos o fotografías al participante para que los 
nombre. En el caso de personas sanas los dibujos se presentan en la pantalla del ordenador y se 
miden los milisegundos que tardan en responder. En el caso de pacientes, los dibujos se 
pueden presentar en el ordenador o en fichas y se mide fundamentalmente la precisión de las 
respuestas. En función de las características de los estímulos (frecuencia, edad de adquisición, 
etc.), las latencias y la precisión en las respuestas varían. 

Además, conviene aplicar también una tarea de denominación de acciones, puesto que, como 
ya se ha señalado, existen muchos casos de disociaciones entre objetos y acciones, es decir, 
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pacientes con trastornos en la denominación de objetos que nombran sin dificultad las 
acciones y pacientes que nombran bien los objetos y fallan en la acciones. Los pacientes con 
anomia pura, por lesión en el lóbulo temporal, suelen tener dificultades con los objetos y seres 
vivos, mientras que los pacientes con lesión en el lóbulo frontal (afásicos de Broca y enfermos 
de Parkinson) tienen más dificultades con las acciones. La tarea de denominación de acciones 
es similar a la de objetos; se presentan dibujos o fotografías de personas realizando una acción 
(p. ej., un chico corriendo, una señora bebiendo, etc.) para que indiquen mediante una palabra 
qué están haciendo. 

La tarea de denominación de dibujos es imprescindible en la evaluación de los pacientes 
afásicos y en las demencias neurodegenerativas, dado que los problemas anómicos suelen 
estar presentes siempre que hay trastornos del lenguaje. De hecho, todas las baterías de 
evaluación del lenguaje tienen alguna prueba de denominación de dibujos, e incluso existe una 
base de 260 dibujos publicada por Snodgrass y Vanderwart (1980) con valores para las 
variables más determinantes en la denominación (frecuencia, longitud, acuerdo en el nombre, 
familiaridad, etc.). También para las acciones se dispone de una buena base de dibujos rea- 
lizados por Druks y Masterson (2000), para los que existen datos normativos de frecuencia, 
edad de adquisición, familiaridad, etcétera. 

El hecho de que un paciente presente dificultades en la tarea de denominación de dibujos no 
significa necesariamente que tenga un trastorno anómico. Esta tarea es muy compleja, pues 
requiere la participación de múltiples procesos cognitivos de todo tipo: visuales, semánticos, 
lingúísticos, motores, etc., de ahí que se deba completar con otras tareas para determinar en 
cada paciente cuál es la causa de sus dificultades. Así, las tareas de reconocimiento visual de 
objetos permitirán comprobar si el paciente tiene problemas visuales o sufre una agnosia 
visual; las tareas de tipo semántico, como las que se han descrito anteriormente, valorarán el 
estado del sistema semántico y, finalmente, las tareas de tipo fonológico permitirán establecer 
si existe un problema en los fonemas o en los procesos articulatorios. 

La tarea de nombrado a partir de una definición puede ser un buen complemento a la de 
denominación de dibujos para medir la capacidad de recuperación de las palabras del léxico 
fonológico. En este caso, en lugar de presentar dibujos al paciente se le proporciona una defi- 
nición para que indique de qué palabra se trata (p. ej., «¿cuál es el nombre del animal salvaje al 
que llaman el rey de la selva?»). Con esta tarea se puede descartar que los problemas sean de 
origen visual. 

También es importante en la evaluación de la producción oral la repetición de palabras. El 
evaluador va diciendo palabras de diferentes frecuencias y longitudes para que el participante 
las repita inmediatamente. Si se trata de una anomia pura o de una anomia semántica, no tendrá 
ninguna dificultad para repetirlas, pero si los problemas se producen en el procesamiento de 
los fonemas o en los procesos articulatorios, se producirán errores también en la repetición. 
En definitiva, para la evaluación de la producción oral, a nivel de palabra, son fundamentales 
tres tipos de tareas: denominación de dibujos (de objetos y acciones) para comprobar el acceso 
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léxico, emparejamiento palabra-dibujo o asociación semántica para valorar el sistema 
semántico y repetición de palabras para comprobar el léxico fonológico y procesos motores. 
A nivel de oración o del discurso, las tareas son más complejas y también es necesario evaluar 
de manera independiente la comprensión y la producción. Para la comprensión de oraciones, la 
tarea más común es la de emparejamiento oración-dibujo, en la que se presentan láminas con 
varios dibujos y el evaluador dice una oración para que el paciente señale el dibujo que le 
corresponde. Por ejemplo, en una lámina pueden aparecer cuatro dibujos: un león 
persiguiendo a un tigre, un tigre persiguiendo a un león, un tigre persiguiendo a un toro y un 
elefante persiguiendo a un león y el evaluador pronuncia la oración «El león es perseguido por 
el tigre» para que el paciente señale el dibujo correspondiente. En el caso del discurso, el 
evaluador lee un texto y le hace varias preguntas al participante, algunas de tipo literal sobre 
cuestiones descritas en el texto y otras de tipo inferencial sobre cuestiones que no se han dicho 
explícitamente pero que el oyente tuvo que inferir para entender el texto. 

Para evaluar la producción de oraciones y discursos se puede pedir al paciente que narre algún 
hecho de su vida, que cuente lo que ha hecho en las últimas vacaciones, etc., y también que 
describa una escena que se le presenta en una lámina (la mayor parte de los tests del lenguaje 
cuentan con esta prueba). Se les muestra la escena y el paciente tiene que describir todo lo que 
ve. Se graba lo que el paciente va diciendo y luego se analiza haciendo recuento de una serie de 
índices, como número de oraciones pronunciadas, longitud de las oraciones, número de 
pausas, número total de palabras, proporción de palabras funcionales respecto a las de 
contenido, tipos de oraciones, errores morfológicos, errores fonológicos, etcétera. 

Para la evaluación del lenguaje escrito, las tareas son similares, con la particularidad de que los 
estímulos se presentan de manera escrita (en el caso de la lectura) o las respuestas se piden de 
forma escrita (en el caso de la escritura). En cuanto a la lectura, se comienza por los procesos 
más simples de identificación de letras hasta terminar en los procesos más complejos de 
comprensión de textos. Para la identificación de letras se pueden utilizar varias tareas 
diferentes: presentar varias letras sobre una hoja e ir mombrando alguna para que el 
participante la señale, emparejar letras mayúsculas y minúsculas, mostrarle una hoja con letras 
para que las nombre, etc. Para el reconocimiento y la lectura de palabras, las dos tareas más 
utilizadas son la de decisión léxica y la de lectura en voz alta. En ambas tareas pueden 
utilizarse estímulos muy variados que tendrán una influencia decisiva en la ejecución de los 
pacientes disléxicos en función de su trastorno: palabras de alta y baja frecuencia, alta y baja 
imaginabilidad, cortas y largas, etc. Para el acceso al significado puede emplearse la tarea de 
emparejamiento palabra escrita-dibujo, y para la compresión de oraciones, la tarea de 
emparejamiento oración escrita-dibujo, en la que se presentan varios dibujos de acciones y una 
oración escrita para que el paciente lea la oración y señale el dibujo que le corresponde. Y en la 
compresión de textos, se le pide que lea un texto y luego responda a varias preguntas sobre el 
contenido del texto. 

En el caso de la escritura, la tarea más común es la de escritura al dictado. En esta tarea se 
pueden dictar letras, sílabas, palabras, seudopalabras, oraciones y textos. Otra tarea consiste en 
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la redacción o composición escrita sobre un tema que se le propone o la descripción escrita de 
una lámina. En el dictado de palabras se pueden manipular diversas variables, como su 
frecuencia, regularidad ortográfica, lexica-lidad, etc., para comprobar el uso de las vías léxica 
y subléxica. También es útil la tarea de denominación escrita de dibujos, similar a la 
denominación oral, con la diferencia de que el paciente debe escribir el nombre del dibujo que 
tiene delante en lugar de decirlo verbalmente. La comparación de estas dos tareas proporciona 
valiosa información sobre algunos pacientes con trastornos anómicos y/o disgráficos. En la 
tabla 12-2 puede verse un resumen de las tareas descritas. 

Todas las tareas descritas aquí (y alguna más) aparecen 
ASAS MSISs en las principales baterías de evaluación del lenguaje. En 
Comprensión oral inglés, el test de evaluación de las afasias más famoso 
AO durante años fue el test de Boston (Goodglass y Kaplan, 

Evaluación de la afasia y de trastornos relacionados, 
Editorial Médica Panamericana, 2005) basado en el 
modelo de Geschwind y cuyo objetivo era clasificar a los 
pacientes en alguno de los grandes síndromes. Con el 
desarrollo de la neuropsicología cognitiva se elaboraron 
baterías que trataban de explicar cada uno de los 
síntomas de los pacientes más que clasificarlos en 
síndromes. En este sentido, la batería de evaluación de 
las afasias más famosa es sin duda PALPA (Kay, Lesser 
y Coltheart, 1992), que ha sido adaptada al castellano 
con el nombre de EPLA (Valle y Cuetos, 1995). Esta 
batería está formada por 58 tareas agrupadas en cuatro 


Discriminación/Repetición de fonemas 
Decisión léxica auditiva 

Repetición de palabras y pseudopalabras 
Emparejamiento palabra hablada-dibujo 


Producción oral 

Asociación semántica 

Denominación de dibujos de objetos y acciones 
Nombrado a una definición 

Repetición de palabras 


Lectura 

Identificación de letras 
Emparejamiento mayúscula-minúscula 
Decisión léxica visual 

Lectura en voz alta 

Emparejamiento palabra escrita-dibujo 


Escritura 
Dictado de letras y silabas 


Dictado de palabras regulares e irregulares 
Dictado de seudopalabras 
Denominación escrita 


Semántica 

Categorización semántica 
Señalar el elemento diferente 
Asociación semántica 
Emparejamiento palabra-dibujo 
Fluidez categorial 


Oración 
Emparejamiento oración-dibujo 
Descripción de una escena 


bloques: procesamiento fonológico, lectura y escritura, 
comprensión de dibujos y palabras y procesamiento de 
oraciones. El bloque de procesamiento fonológico 
consta de 17 tareas que evalúan todos los componentes 
del sistema de percepción oral, desde la discriminación 
de fonemas hasta el reconocimiento de palabras. El 
bloque de lectura y escritura está formado por 17 tareas 
destinadas a los procesos del lenguaje escrito, 
principalmente identificación de letras, lectura de 
palabras de distintos tipos y escritura al dictado de 


palabras y seudopalabras. El bloque de comprensión de dibujos consta de 8 tareas destinadas al 
procesamiento semántico y la producción oral, con tareas de asociación semántica, sinonimia 
y, por supuesto, denominación de dibujos. El último bloque, de procesamiento de oraciones, 
formado por 6 tareas, está dirigido a la evaluación de la comprensión de oraciones, 
principalmente con tareas de emparejamiento oración-dibujo. 
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La batería BETA (Cuetos y González-Nos ti, 2009) tiene una estructura similar. Está formada 
por 6 bloques con 5 tareas por bloque, es decir, 30 tareas en total. El primer bloque está 
destinado a la comprensión oral, evalúa todos los procesos que intervienen en la comprensión 
de palabras, desde la identificación de los fonemas hasta los procesos semánticos. El segundo 
bloque, destinado a la producción oral, incluye desde los procesos semánticos hasta los 
puramente fonológicos, pasando por los de recuperación de las palabras. El tercer bloque está 
dedicado a la lectura, con tareas que evalúan todos los componentes del sistema lector: la 
identificación de letras, el reconocimiento visual de palabras o el acceso al significado. El 
cuarto bloque está destinado a la escritura al dictado, tanto de palabras regulares como de 
ortografía arbitraria, y el quinto bloque a los procesos puramente semánticos mediante la 
utilización de dibujos y palabras. El sexto y último bloque está dedicado a la comprensión y 
producción de oraciones. 

Una cuestión muy importante a la hora de aplicar las pruebas es la de anotar los tiempos de 
respuesta y los errores que comete el paciente. Los tiempos son importantes, porque no es lo 
mismo que el paciente responda inmediatamente a la pregunta o que se quede pensando 
durante varios segundos o minutos. Los errores, por su parte, son una fuente muy valiosa de 
información, ya que el tipo de error sugiere cuál es el proceso dañado responsable del trastorno 
del paciente. Un circunloquio en la tarea de denominación de dibujos indica que el paciente 
conoce el objeto pero no consigue acceder al léxico; un error fonológico, en cambio, indica 
que ha accedido al léxico pero tiene dificultades en el procesamiento fonológico. Un error de 
sustitución de un grafema por otro en la lectura de seudopalabras (p. ej., leer «pluca» donde 
dice «fluca») indica un problema en la aplicación de las reglas grafema-fonema, y una 
lexicalización (p. ej., leer «flaca» donde dice «fluca») indica el uso de la vía léxica. 

También es importante tener en cuenta las fluctuaciones de los pacientes, puesto que algunos 
días pueden hacer las tareas peor que de costumbre, porque se encuentran en un estado de 
ánimo bajo, porque están cansados o por efecto de la medicación, mientras que otros días que 
están de buen ánimo realizan bastante bien las tareas. Por eso es fundamental evaluarlos en 
varias sesiones diferentes e, incluso, algunas de las pruebas importantes dividirlas en varias 
sesiones para que los altibajos les afecten menos. Esta división es especialmente importante 
cuando se quiere comparar a un paciente en dos tareas diferentes que están formadas por los 
mismos ítems. Por ejemplo, si un paciente tiene dificultades en la tarea de emparejamiento 
palabra hablada-dibujo, nos quedará la duda de si esas dificultades se producen porque no 
entiende las palabras, por ejemplo porque sufre una sordera verbal, porque no entiende los 
dibujos por algún tipo de agnosia visual o porque no entiende ni las palabras ni los dibujos 
debido a un trastorno semántico. Para averiguarlo se puede pasar también la tarea de 
emparejamiento palabra-escrita dibujo con los mismos estímulos. Así, si hace bien esta tarea 
podremos deducir que el problema radica en la comprensión de las palabras habladas, pero si 
también la hace mal probablemente se trate de un trastorno semántico. No podemos pasar las 
dos tareas el mismo día porque se trata de los mismos estímulos y, por consiguiente, la que se 
realizara en segundo lugar saldría beneficiada. Por otra parte, si las pasamos en días distintos 
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podrían verse afectadas por la fluctuación que sufre la mayoría de los pacientes. Por ello, lo 
ideal es pasar la mitad de los estímulos en la palabra hablada y la otra mitad en la escrita y, en 
la siguiente sesión, intercambiar los estímulos. De esta manera, las diferencias entre las dos 


tareas serían exclusivamente debidas a las tareas y no a los cambios del paciente. 


RESUMEN 


Los trastornos del lenguaje producidos por lesión cerebral son un valioso medio de 
poner a prueba los modelos de procesamiento lingúístico elaborados en los laboratorios 
con individuos normales, ya que se considera que la conducta de los pacientes no es 
diferente de la conducta de las personas sanas; el sistema de procesamiento es el 
mismo, con la diferencia de que los pacientes tienen dañado alguno de sus 
componentes. 

El hecho de que algunos pacientes sean incapaces de realizar ciertas tareas y, en 
cambio, puedan seguir haciendo otras incluso más difíciles, como las disociaciones 
dobles, es una prueba clara de que los procesos pueden ser dañados de manera 
selectiva. Muchos modelos de procesamiento lingiístico han tenido que ser 
reformulados para poder explicar los datos de algunos pacientes afásicos. 
Tradicionalmente, los trastornos del lenguaje se clasificaban en grandes síndromes 
(afasia de Broca, afasia de Wernicke, etc.). Sin embargo, para poder explicarlos de 
manera eficaz, es mejor interpretar los síntomas en función de los componentes del 
procesamiento lingúístico que se encuentran dañados. Así, en la comprensión oral, se 
pueden producir trastornos en la identificación de los fonemas, en el reconocimiento de 
palabras o en el acceso al significado. En la producción oral los trastornos pueden 
afectar al sistema semántico, al léxico o al procesamiento fonológico. También en la 
lectura y la escritura se pueden producir diferentes tipos de trastornos (dislexias y 
disgrafias) en función del componente o los componentes dañados. 

Los trastornos del lenguaje en las demencias neurodegenerativas, enfermedad de 
Alzheimer, enfermedad de Parkinson o demencias frontotemporales, ayudan a entender 
cómo se va desintegrando el sistema de procesamiento lingúístico como consecuencia 
de la destrucción progresiva del cerebro. 

Una buena evaluación del lenguaje requiere tareas variadas que permitan medir los 
principales componentes del sistema de procesamiento lingilístico, tanto a nivel de 
comprensión como de producción y tanto en el lenguaje oral como en el escrito. 


Preguntas de reflexión 


¿Por qué se interesan los psicólogos cognitivos en los trastornos del lenguaje? 

¿Por qué tienen dificultades los pacientes con sordera para la forma de las palabras en la 
tarea de decisión léxica? 

¿Qué tareas podrían ayudarnos a concluir si un paciente tiene anomia semántica o 
anomia pura? 

¿Por qué los pacientes con dislexia profunda cometen errores semánticos al leer? 

Cita cinco tareas en las que un paciente con demencia semántica presentaría serias 
dificultades. 
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